Po raz pierwszy w historii sieci maszyny przegoniły ludzi. Z czerwcowych danych Cloudflare wynika, że automaty odpowiadają już za 57,5 procent ruchu HTML w internecie, a żywi użytkownicy za zaledwie 42,5 procent. To nie jest tylko statystyczna ciekawostka: większość tego automatycznego ruchu napędzają boty AI, które pobierają tysiące stron na każde jedno odesłanie zwrotne do wydawcy.
Dla branży SEO i AIO to moment przełomowy. Reguły gry, w których robot wyszukiwarki indeksował stronę po to, by potem przysłać jej czytelnika, właśnie przestają obowiązywać. Crawlery dużych modeli językowych biorą treść, a w zamian oddają ułamek dawnego ruchu. Pytanie, które zadaje sobie dziś każdy wydawca, brzmi: czy otwieranie drzwi botom AI wciąż ma sens.
Pierwsza większość maszyn w sieci
Według danych Cloudflare Radar z 3 czerwca 2026 roku boty wygenerowały 57,5 procent wszystkich żądań HTML, podczas gdy ludzie odpowiadali za 42,5 procent. To pierwszy raz, kiedy automatyczny ruch przekroczył próg połowy i stał się dominującą siłą w sieci. Pomiar dotyczy żądań HTML i celowo pomija wideo, pocztę oraz ruch z gier, więc mówimy o samym rdzeniu stron, które odwiedzają zarówno ludzie, jak i roboty.
Warto dodać kontekst, bo trend nie pojawił się znikąd. Już w 2025 roku firma Imperva szacowała, że automaty odpowiadają za około 53 procent całego ruchu w sieci, choć tamten pomiar obejmował także wywołania aplikacji i interfejsów API. Różnica metodologii jest istotna, lecz kierunek pozostaje ten sam: udział maszyn rośnie rok do roku, a 2026 to pierwszy rok, w którym przeważyły one w samym rdzeniu stron WWW.
Co napędza ten skok? Odpowiedź jest jednoznaczna: agentowa AI. Crawlery zbierające dane do trenowania modeli, boty asystentów odpowiadających na zapytania w czasie rzeczywistym oraz nowe agenty informacyjne, które monitorują sieć w tle, razem tworzą falę automatycznego ruchu o skali nieznanej jeszcze dwa lata temu.
Ile rośnie ruch crawlerów AI
Skala wzrostu robi wrażenie. Udział GPTBota od OpenAI w zweryfikowanym ruchu botów wzrósł z 4,7 procent w lipcu 2024 roku do 11,7 procent w lipcu 2025 roku. W tym samym okresie aktywność tego crawlera zwiększyła się o około 305 procent. Patrząc szerzej, w całym 2024 roku ruch crawlerów AI urósł o blisko 757 procent, co pokazuje, jak gwałtownie modele językowe zaczęły konsumować otwartą sieć.
W maju 2026 roku crawlery AI stanowiły 20,3 procent zweryfikowanego ruchu botów, a wyszukiwanie oparte na AI dokładało kolejne 6,5 procent. Wśród nazwanych crawlerów AI prowadził Googlebot z udziałem 27,26 procent żądań, przed GPTBotem (11,48 procent) oraz ClaudeBotem od Anthropic (9,73 procent). Co ciekawe, kolejność OpenAI i Anthropic potrafi się zmieniać z miesiąca na miesiąc: w kwietniu to ClaudeBot prowadził, z wynikiem 11,69 procent wobec 9,84 procent GPTBota.
Crawl-to-referral: ile stron za jedno kliknięcie
Najtwardszy argument w całej dyskusji to wskaźnik crawl-to-referral, czyli stosunek liczby pobranych stron do liczby odwiedzin, które bot odsyła z powrotem na witrynę. Im wyższa liczba, tym gorsza wymiana dla wydawcy: robot bierze dużo treści, a w zamian przysyła znikomy ruch. To właśnie ta metryka najmocniej obnaża nową ekonomię sieci.
| Crawler | Crawl-to-referral | Okres i zmiana |
|---|---|---|
| ClaudeBot (Anthropic) | 11 122:1 | tydzień 25.05–1.06.2026, poprawa z 23 951:1 w I kw. |
| GPTBot / OpenAI | 857:1 | najnowszy tydzień, lepiej niż 1 276:1 w I kw. |
| PerplexityBot | 111:1 | stabilnie przez I kw. 2026 |
| Microsoft Copilot | 33:1 | poprawa o około 20 procent |
| Googlebot (klasyczne wyszukiwanie) | 4,9:1 | punkt odniesienia, stabilnie |
Dysproporcja jest ogromna. Tradycyjny Googlebot pobiera około pięciu stron na każde odesłanie, bo jego model biznesowy wciąż opiera się na wysłaniu użytkownika na witrynę. Crawler Anthropic, nawet po wyraźnej poprawie, pobiera ponad jedenaście tysięcy stron, zanim odeśle pojedynczego odwiedzającego. To różnica rzędu wielkości, która tłumaczy, dlaczego wydawcy coraz głośniej mówią o nierównej wymianie.
Trzeba oddać sprawiedliwość: wskaźniki się poprawiają. ClaudeBot przeszedł drogę z 45 458:1 w styczniu, przez 25 023:1 w lutym, do okolic 11 700:1 w połowie marca i 11 122:1 na przełomie maja i czerwca. OpenAI zeszło z 1 276:1 do 857:1. Poprawa wynika głównie z tego, że crawlery wyszukiwawcze (OAI-SearchBot i podobne) generują realne kliknięcia wychodzące, w miarę jak rosną produkty pokroju ChatGPT Search. Mimo to przepaść wobec klasycznego wyszukiwania pozostaje gigantyczna.
Trenowanie kontra wyszukiwanie
Kluczowe rozróżnienie dotyczy celu, w jakim bot pobiera stronę. Z danych za maj 2026 wynika, że 51,8 procent żądań crawlerów AI służy trenowaniu modeli, 35,7 procent to ruch mieszany (trenowanie plus pobieranie do odpowiedzi), a tylko 9,3 procent stanowi czyste wyszukiwanie. Ta ostatnia kategoria rośnie, bo w kwietniu wynosiła 7,5 procent, ale wciąż jest niewielka.
Znaczenie tego podziału jest fundamentalne. Crawlery trenujące praktycznie nie odsyłają ruchu: pobierają treść, by zasilić model, a użytkownik dostaje odpowiedź wprost w czacie, bez wizyty na witrynie. Dopiero crawlery wyszukiwawcze mają mechanizm cytowania i linkowania, który potrafi przysłać czytelnika. Dlatego dla wydawcy nie każdy bot AI jest taki sam, a strategia dostępu powinna rozróżniać te dwa światy.
Problem polega na tym, że granica między trenowaniem a wyszukiwaniem coraz częściej się zaciera. Aż 35,7 procent żądań to ruch mieszany, w którym ten sam bot raz pobiera stronę do bazy treningowej, a innym razem sięga po nią, by odpowiedzieć na bieżące zapytanie. Z perspektywy serwera trudno te intencje rozdzielić, a to utrudnia precyzyjne sterowanie dostępem. W praktyce wydawca, który chce wpuścić tylko crawler wyszukiwawczy, musi polegać na deklarowanej tożsamości bota i jego zakresach adresów IP, a te bywają zmieniane.
Nowa ekonomia treści
Pod tymi liczbami kryje się głębsza zmiana modelu biznesowego całej sieci. Przez dwie dekady umowa była niepisana, lecz czytelna: wydawca udostępniał treść crawlerowi, a wyszukiwarka w zamian kierowała na stronę użytkowników, których dało się zmonetyzować reklamą lub sprzedażą. Wskaźnik pięciu pobranych stron na jedno odesłanie u Googlebota dobrze opisywał tę równowagę. Crawlery trenujące zrywają ten układ, bo zabierają treść, nie oferując nic w zamian poza obecnością w odpowiedzi, której wydawca nie kontroluje i z której rzadko czerpie ruch.
To rodzi pytanie o wartość samej treści. Jeśli model potrafi streścić artykuł i podać odpowiedź bez odsyłania czytelnika, malejąca liczba kliknięć uderza w przychody reklamowe i afiliacyjne. Część dużych wydawców odpowiada żądaniem opłat licencyjnych, część stawia treść za logowaniem lub paywallem, a jeszcze inni budują własne kanały dystrybucji, takie jak newslettery i aplikacje, gdzie relacja z odbiorcą nie zależy od pośrednika. Wszystkie te ścieżki łączy jedno założenie: nie można już liczyć wyłącznie na ruch z otwartej sieci.
Co to znaczy dla SEO i AIO
Najważniejszy wniosek brzmi: widoczność w sieci przestała być równoznaczna z ruchem. Strona może być masowo pobierana, cytowana w odpowiedziach modeli i obecna w streszczeniach AI, a mimo to nie zobaczyć ani jednej dodatkowej wizyty. Klasyczne SEO, oparte na pozycji w niebieskich linkach, zderzyło się ze światem, w którym użytkownik często podejmuje decyzję jeszcze przed kliknięciem.
To właśnie domena AIO, czyli optymalizacji pod silniki odpowiedzi. Tu liczy się nie tyle pozycja, ile to, czy model potrafi treść znaleźć, zrozumieć, zaufać jej i poprawnie zacytować. Czysta struktura, jednoznaczne fakty i dane uporządkowane tak, by dało się je wyciągnąć bez dwuznaczności, biją dziś samą objętość tekstu. Więcej o tej zmianie pisaliśmy przy okazji tego, jak Lighthouse 13.3 zaczął sprawdzać plik llms.txt, oraz analizując sytuację, w której CNN pozwało Perplexity AI o sposób korzystania z treści wydawców.
Dla specjalistów oznacza to konkretne przesunięcia w pracy. Mierzenie skuteczności trzeba rozszerzyć poza ruch organiczny: liczą się cytowania w AI Overviews, obecność w odpowiedziach AI Mode, wzmianki marki w streszczeniach oraz to, czy agenty informacyjne w ogóle sięgają po naszą domenę. Raportowanie samych sesji z wyszukiwarki coraz słabiej opisuje realny zasięg.
Reakcja wydawców: blokady i llms.txt
Wydawcy nie pozostają bierni. Od 1 lipca 2025 roku, gdy blokowanie crawlerów AI stało się u Cloudflare ustawieniem domyślnym, ponad milion klientów firmy aktywowało tę ochronę. W ciągu kolejnych pięciu miesięcy zablokowali oni 416 miliardów żądań scrapujących od botów AI. GPTBot pojawia się dziś w 5,52 procent reguł DISALLOW w plikach robots.txt (dane za I kwartał 2026), co czyni go najczęściej blokowanym crawlerem AI.
Rośnie też adopcja pliku llms.txt, czyli standardu, który ma podpowiadać modelom, jak korzystać z treści witryny. Wdrożyło go około 10,13 procent z blisko 300 tysięcy zbadanych domen, przy czym poziom adopcji jest dość równy w różnych kategoriach ruchu. Problem w tym, że, jak pokazuje analiza, boty AI rzadko w ogóle pobierają ten plik, więc jego praktyczny wpływ na widoczność pozostaje na razie ograniczony.
Decyzja o blokadzie nie jest prosta. Zamknięcie crawlerów trenujących chroni treść przed bezzwrotnym wykorzystaniem, ale jednoczesne odcięcie botów wyszukiwawczych może odebrać marce szansę na cytowanie w ChatGPT Search, Perplexity czy AI Mode. Coraz częściej rekomendowane podejście to selektywność: przepuszczać crawlery, które realnie odsyłają ruch, a ograniczać te, które tylko konsumują. W tym kontekście warto przypomnieć, że również Google daje wydawcom mechanizm wypisania się z AI Overviews i AI Mode, co dokłada kolejną dźwignię do panelu kontroli nad treścią.
Reakcje branży
W środowisku SEO komentarze są dość zgodne co do diagnozy, choć rozbieżne co do recepty. Z jednej strony słychać głosy, że nierówna wymiana między crawlerami a wydawcami jest nie do utrzymania i wymaga albo regulacji, albo modeli licencyjnych, w których dostawcy modeli płacą za dostęp do treści. Z drugiej strony część praktyków podkreśla, że obecność w odpowiedziach AI to nowy kanał budowy marki, którego nie da się zmierzyć starymi metrykami, lecz który realnie wpływa na decyzje zakupowe.
Najmocniej zmianę odczują konkretne segmenty: wydawcy treści, platformy B2B SaaS, sklepy e-commerce, usługi lokalne oraz serwisy porównawcze i afiliacyjne. To one historycznie żyły z ruchu organicznego, więc przesunięcie wartości od kliknięcia do cytowania uderza w ich modele najmocniej. Dla tych firm pytanie nie brzmi już, jak wejść wyżej w wynikach, lecz jak w ogóle pozostać widocznym w świecie, w którym odpowiedź zapada przed kliknięciem.
Co dalej
Najbliższe miesiące przyniosą trzy równoległe procesy. Po pierwsze, dalsze doskonalenie wskaźników crawl-to-referral po stronie dostawców wyszukiwarek AI, bo to one mają interes w tym, by wydawcy nie zatrzaskiwali drzwi. Po drugie, dojrzewanie narzędzi pomiaru widoczności w AI, które pozwolą raportować cytowania równie precyzyjnie, jak dziś raportujemy pozycje. Po trzecie, presja prawna i biznesowa w stronę umów licencyjnych, które uporządkują dostęp modeli do treści.
Dla zespołów SEO i AIO praktyczny plan na teraz jest prosty. Trzeba zinwentaryzować, które boty odwiedzają witrynę i z jakim celem, świadomie zdecydować, którym dać dostęp, a którym nie, oraz zacząć mierzyć obecność w odpowiedziach modeli obok klasycznego ruchu. Sieć, w której maszyn jest więcej niż ludzi, nie cofnie się do poprzedniego stanu. Wygrają ci, którzy najszybciej nauczą się grać według nowych zasad.
W krótkiej perspektywie warto przełożyć te wnioski na konkretną listę działań, którą da się odhaczyć w panelu administracyjnym i w logach serwera:
- Przejrzyj logi dostępu i zidentyfikuj największe crawlery AI, sortując je po liczbie pobranych adresów, a nie po nazwie.
- Rozdziel boty trenujące od wyszukiwawczych i ustaw reguły w robots.txt tak, by przepuszczać te, które realnie odsyłają ruch.
- Wdróż plik llms.txt, ale traktuj go jako uzupełnienie, a nie zabezpieczenie, bo modele rzadko go respektują.
- Dodaj do raportowania metryki widoczności w AI: cytowania, wzmianki marki i udział w odpowiedziach asystentów.
- Zadbaj o czystą strukturę treści, dane uporządkowane i jednoznaczne fakty, które model łatwo wyciągnie i poprawnie przypisze.
Dłuższa perspektywa zależy od tego, czy uda się wypracować model, w którym dostęp modeli do treści zostanie wyceniony i uregulowany. Dopóki to nie nastąpi, każdy wydawca będzie samodzielnie ważył dwie wartości: ochronę treści przed bezzwrotnym pobieraniem oraz szansę na obecność w odpowiedziach, z których korzysta coraz większa część użytkowników. To nie jest wybór jednorazowy, lecz decyzja, którą trzeba będzie rewidować wraz z kolejnymi raportami o ruchu w sieci.
FAQ
Czy boty naprawdę generują więcej ruchu niż ludzie?
Tak. Według danych Cloudflare Radar z 3 czerwca 2026 roku automaty odpowiadały za 57,5 procent żądań HTML, a ludzie za 42,5 procent. To pierwszy raz, gdy maszyny przeważyły w rdzeniu stron WWW. Pomiar pomija wideo, pocztę i gry.
Co oznacza wskaźnik crawl-to-referral?
To stosunek liczby stron pobranych przez crawler do liczby odwiedzin, które ten crawler odsyła z powrotem na witrynę. Wartość 11 122:1 oznacza, że bot pobrał ponad jedenaście tysięcy stron, zanim przysłał jednego odwiedzającego. Klasyczny Googlebot ma wskaźnik około 4,9:1.
Czy powinienem zablokować crawlery AI w robots.txt?
To zależy od celu bota. Crawlery trenujące pobierają treść bez odsyłania ruchu, więc ich blokada chroni treść. Crawlery wyszukiwawcze potrafią jednak przysłać czytelnika przez cytowanie w ChatGPT Search czy AI Mode. Rekomendowane jest podejście selektywne, a nie zamykanie wszystkiego naraz.
Czy plik llms.txt rozwiązuje problem?
Na razie nie w pełni. Wdrożyło go około 10 procent zbadanych domen, ale analizy pokazują, że boty AI rzadko go pobierają, więc jego praktyczny wpływ na widoczność pozostaje ograniczony. To standard obiecujący, lecz wymagający szerszego poszanowania po stronie modeli.
Jak mierzyć skuteczność w świecie AIO?
Poza ruchem organicznym warto śledzić cytowania w AI Overviews i odpowiedziach AI Mode, wzmianki marki w streszczeniach modeli oraz to, czy agenty informacyjne sięgają po domenę. Sam pomiar sesji z wyszukiwarki coraz słabiej opisuje realny zasięg marki.
