Crawl-to-referral: boty AI a ruch wydawcow

Boty sztucznej inteligencji pobieraja dzis tysiace stron na kazde jedno przekierowanie, ktore odsylaja z powrotem do wydawcy. Najnowsze dane Cloudflare, przeliczone ponownie dla pelnego czerwca 3 lipca 2026 roku, pokazuja, ze przepasc miedzy tym, ile tresci crawlery AI konsumuja, a tym, ile ruchu zwracaja, nie tylko sie utrzymuje, ale w przypadku niektorych graczy dramatycznie sie poglebia. Dla branzy SEO i AIO to nie jest ciekawostka techniczna, lecz sygnal, ze fundament ekonomiczny otwartego internetu wlasnie sie przesuwa.

Kontekst: od wyszukiwarki, ktora oddaje klikniecia, do modelu, ktory ich nie oddaje

Przez ponad dwie dekady umowa miedzy wydawcami a Google byla prosta. Googlebot indeksowal strony, a wyszukiwarka odsylala uzytkownikow z powrotem do zrodel. Ta wymiana miala swoja metryke, ktora dzis nazywamy wskaznikiem crawl-to-referral, czyli stosunkiem liczby pobranych podstron do liczby przekierowan wyslanych do wydawcy. Dla klasycznego Googlebota wynosi on okolo 5 do 1. Innymi slowy, Google pobiera piec stron na kazde jedno klikniecie, ktore realnie trafia do wydawcy. To wymiana, ktora przez lata dawala sie obronic.

Modele jezykowe zerwaly ten uklad. Asystenci tacy jak ChatGPT, Perplexity czy Claude pobieraja tresc, syntetyzuja ja i prezentuja odpowiedz bez koniecznosci wyslania uzytkownika na strone zrodlowa. Uzytkownik dostaje gotowa odpowiedz, a wydawca nie dostaje ani odslony, ani reklamowego grosza. Wskaznik crawl-to-referral przestal opisywac wymiane, a zaczal opisywac jednostronny pobor. To wlasnie ten mechanizm dokumentuje najnowsza analiza Cloudflare, przywolywana szeroko przez serwis TechnologyChecker w aktualizacji z lipca 2026 roku.

Kluczowe fakty: liczby, ktore powinny zapalic lampke ostrzegawcza

Zestawienie oparte na oknie pomiarowym od 25 maja do 1 czerwca 2026 roku pokazuje skale dysproporcji. Roznice miedzy poszczegolnymi platformami sa ogromne, a najgorszy wynik nalezy do gracza, ktorego w tym samym miesiacu udzial w ruchu botow gwaltownie wzrosl.

Platforma (bot)	Wskaznik crawl-to-referral	Interpretacja
Google (Googlebot)	5 : 1	Klasyczna wymiana, wciaz odsyla ruch
Perplexity	190 : 1	Pogorszenie z 95 : 1 w kwietniu
OpenAI (GPTBot)	857 : 1	Poprawa z 1 252 : 1, wciaz bardzo wysoki
Anthropic (ClaudeBot)	11 122 : 1	Najgorszy wynik w calej tabeli

Skala tych liczb robi wrazenie dopiero w zestawieniu. Anthropic pobiera ponad 11 tysiecy stron na jedno przekierowanie, co jest wynikiem mniej wiecej trzynastokrotnie gorszym niz i tak wysoki wskaznik OpenAI. Perplexity, ktore dlugo bylo chwalone za relatywnie zdrowa proporcje, w ciagu jednego kwartalu podwoilo swoj wskaznik, przechodzac ze stosunku 95 do 1 na 190 do 1. Ruch idzie wiec w zla strone niemal u wszystkich, ktorzy karmia modele jezykowe.

Czerwcowa roszada w udzialach ruchu botow

Druga warstwa danych dotyczy tego, kto w ogole crawluje najwiecej. Po ponownym przeliczeniu pelnego czerwca, wykonanym 3 lipca 2026 roku, obraz udzialow w ruchu botow AI zmienil sie wyraznie w porownaniu z majem.

ClaudeBot (Anthropic): 19,8 procent ruchu botow AI, niemal podwojenie wobec 9,7 procent w maju.
GPTBot (OpenAI): 9,4 procent, spadek z 11,48 procent miesiac wczesniej.
Googlebot: 25,18 procent, wciaz najwiekszy pojedynczy crawler w zestawieniu.
Bytespider (ByteDance): 7,65 procent.

Polaczenie obu warstw daje niepokojacy wniosek. Gracz o najgorszym wskazniku crawl-to-referral, czyli Anthropic, jednoczesnie najszybciej zwieksza swoj apetyt na tresc. Podwojenie wolumenu pobran w czerwcu bez odpowiadajacego mu wzrostu ruchu zwrotnego oznacza, ze luka miedzy poborem a oddawaniem ruchu poszerza sie w tempie, ktorego wydawcy nie widzieli wczesniej.

Coraz wiecej crawlowania to realne wyszukiwanie

Trzecia liczba niuansuje caly obraz. Crawle klasyfikowane jako wyszukiwanie, czyli pobieranie tresci w czasie rzeczywistym na potrzeby konkretnego zapytania uzytkownika, stanowily 9,3 procent ruchu botow AI w maju, wobec 7,5 procent w kwietniu. To istotne rozroznienie. Czesc pobran nie sluzy trenowaniu modelu, lecz odpowiadaniu na biezace pytanie, a wiec teoretycznie moze prowadzic do cytowania i przekierowania. Rosnacy udzial takich crawli jest dla wydawcow raczej dobra wiadomoscia, bo to wlasnie ta kategoria ruchu ma szanse odsylac uzytkownikow z powrotem.

Skala calego zjawiska staje sie zrozumiala, gdy dolozy sie do niej dane o zasiegu asystentow. Sam ChatGPT raportowal okolo 900 milionow tygodniowych uzytkownikow, co potwierdzono pod koniec lutego 2026 roku. Kazde z tych narzedzi potrzebuje swiezej tresci, a zrodlem tej tresci pozostaje otwarty internet tworzony przez wydawcow, ktorzy z tego poboru czerpia coraz mniej.

Co to znaczy dla SEO i AIO

Dla specjalistow SEO i AIO wskaznik crawl-to-referral przestaje byc abstrakcja z raportu, a staje sie metryka, ktora warto monitorowac obok pozycji i widocznosci. Jesli boty AI pobieraja Twoja tresc masowo, ale nie odsylaja ruchu, to klasyczny model mierzenia sukcesu oparty wylacznie na sesjach z organicznych klikniec przestaje opisywac rzeczywistosc. Widocznosc przenosi sie do warstwy, ktorej dotychczasowe narzedzia analityczne w ogole nie pokazuja. Pisalismy o tym, jak Search Console pokazuje widocznosc w AI, ale ukrywa klikniecia, i najnowsze dane Cloudflare tylko potwierdzaja te diagnoze.

Praktyczny wniosek jest dwutorowy. Po pierwsze, skoro coraz wiecej crawlowania to realne wyszukiwanie generujace odpowiedzi, walka o cytowanie w tych odpowiedziach staje sie kluczowa. Optymalizacja pod silniki odpowiedzi, czyli AIO, przestaje byc eksperymentem, a zaczyna byc koniecznoscia. Tresc, ktora jest latwa do zaindeksowania, wyekstrahowania i zacytowania, ma szanse zamienic pobor w widocznosc marki, nawet jesli nie zawsze konczy sie klikiem.

Po drugie, wydawcy zyskuja mocny argument w rozmowie o kontroli dostepu. Skoro relacja przestala byc wymiana, coraz wiecej serwisow zaczyna traktowac dostep botow AI jak zasob, ktory mozna reglamentowac lub wyceniac. Narzedzia do zarzadzania crawlerami, blokady na poziomie pliku robots.txt oraz mechanizmy rozliczania za dostep przestaja byc nisza, a staja sie elementem strategii wydawniczej.

Jak zamienic pobor w widocznosc

Zamiast walczyc z crawlerami, ktorych i tak nie da sie w pelni zatrzymac, warto zadbac o to, by kazde pobranie mialo szanse zaowocowac cytatem lub wzmianka marki. W praktyce oznacza to jasne definicje na poczatku tekstu, krotkie bloki odpowiedzi, wyrazne naglowki, uporzadkowane dane i jednoznaczne encje. Warto tez sledzic, gdzie marka faktycznie pojawia sie w odpowiedziach AI. O nowych raportach mierzacych taka obecnosc pisalismy przy okazji tego, jak Bing Webmaster Tools pokazuje Citation Share, czyli udzial marki w cytowaniach modeli.

Reakcje branzy

W srodowisku wydawcow i analitykow SEO dominuja dwa tony. Pierwszy to niepokoj o model biznesowy. Jesli asystent AI odpowiada na pytanie, korzystajac z tresci wydawcy, a nie odsyla uzytkownika, to reklamowy i subskrypcyjny fundament mediow internetowych sie kruszy. Analitycy zwracaja uwage, ze problem nie dotyczy juz tylko trenowania modeli, ale takze biezacego odpowiadania na pytania, gdzie odpowiedz zastepuje wizyte.

Drugi ton to pragmatyzm. Czesc branzy przekonuje, ze skoro tego procesu nie da sie odwrocic, trzeba nauczyc sie w nim wygrywac. To oznacza akceptacje faktu, ze widocznosc w odpowiedziach AI jest nowa waluta, a marki, ktore pojawiaja sie w odpowiedziach asystentow, buduja rozpoznawalnosc jeszcze przed klikiem. W tym ujeciu wysoki wskaznik crawl-to-referral nie jest wylacznie zagrozeniem, lecz mapa pokazujaca, gdzie tresc jest konsumowana, a gdzie mozna powalczyc o cytowanie.

Pojawiaja sie tez glosy ostrzegajace przed dalej idacym ryzykiem. Jesli modele zaczna karmic sie glownie tresciami generowanymi przez inne modele, jakosc odpowiedzi moze spadac. Ten scenariusz opisywalismy szerzej w tekscie o tym, dlaczego zatruty internet grozi kolapsem wyszukiwania AI. Masowy pobor bez odplywu ruchu do wydawcow moze na dluzsza mete oslabic sam material, na ktorym modele buduja swoje odpowiedzi.

Trening kontra wyszukiwanie: dlaczego to rozroznienie decyduje o strategii

Latwo wrzucic wszystkie boty AI do jednego worka, ale dane pokazuja, ze warto je rozdzielic. Crawler trenujacy pobiera tresc, by zasilic model, i z natury nie odsyla ruchu, bo w momencie pobrania nie ma zadnego uzytkownika po drugiej stronie. Crawler wyszukiwawczy dziala inaczej: pobiera strone, bo ktos wlasnie zadal pytanie, a wygenerowana odpowiedz moze zawierac cytat i link do zrodla. To wlasnie dlatego wzrost udzialu crawli wyszukiwawczych z 7,5 do 9,3 procent jest wart uwagi. Rosnie ta czesc ruchu botow, ktora realnie da sie zamienic na widocznosc.

W praktyce oznacza to, ze strategia obrony i strategia ofensywy powinny byc rozne. Wobec crawli czysto trenujacych wydawca ma do dyspozycji glownie narzedzia kontroli dostepu, bo z takiej relacji trudno wycisnac ruch zwrotny. Wobec crawli wyszukiwawczych sensowniejsza jest optymalizacja pod cytowanie, poniewaz kazde pobranie moze skonczyc sie wzmianka marki w odpowiedzi asystenta. Problem w tym, ze wiele botow nie deklaruje jednoznacznie swojego celu, a ten sam agent moze raz pobierac tresc do treningu, a raz do biezacej odpowiedzi. Dlatego rozroznienie, ktore proponuje Cloudflare, jest tak cenne dla wydawcow probujacych zaplanowac reakcje.

Jak zmierzyc crawl-to-referral u siebie

Dobra wiadomosc jest taka, ze wskaznik crawl-to-referral da sie policzyc na wlasnych danych, bez czekania na globalne raporty. Wystarczy zestawic dwie liczby z wlasnej infrastruktury: ile razy dany bot pobral podstrony w danym okresie i ile sesji przyszlo z danej platformy AI jako zrodlo odsylajace. Kilka krokow pozwala zbudowac taki obraz.

Zbierz logi serwera. W logach dostepu widac user-agenty crawlerow, takie jak GPTBot, ClaudeBot, PerplexityBot czy Googlebot. Zliczenie ich odslon daje licznik pobran.
Zidentyfikuj ruch odsylajacy z AI. W analityce warto wyodrebnic sesje przychodzace z domen asystentow oraz z powierzchni odpowiedzi AI. To daje mianownik, czyli liczbe realnych przekierowan.
Policz stosunek per platforma. Podziel liczbe pobran przez liczbe przekierowan osobno dla kazdego bota. Dopiero rozbicie na platformy pokazuje, ktory gracz pobiera duzo i nie oddaje nic, a ktory realnie odsyla uzytkownikow.
Obserwuj trend, nie jedna liczbe. Pojedynczy pomiar niewiele mowi. Dopiero seria miesiecy pokazuje, czy relacja z dana platforma sie poprawia, czy pogarsza, tak jak w czerwcowych danych Cloudflare.

Taki wlasny pomiar bywa bardziej wiarygodny niz srednie rynkowe, bo odzwierciedla dokladnie te tresci, ktore publikujesz, i te platformy, ktore realnie z nich korzystaja. Serwis o wysokiej wartosci merytorycznej moze byc pobierany intensywniej niz przecietna, a jednoczesnie miec szanse na wyzszy udzial cytowan, jesli tresc jest dobrze przygotowana pod ekstrakcje.

Co dalej

Kilka kierunkow wydaje sie przesadzonych. Po pierwsze, metryki. Wskaznik crawl-to-referral bedzie coraz czesciej pojawial sie w raportach obok pozycji w wynikach i udzialu w cytowaniach. Zespoly SEO, ktore juz teraz zaczna go mierzyc na wlasnych logach serwerowych, zyskaja przewage w rozumieniu, jak modele AI traktuja ich tresc.

Po drugie, kontrola dostepu. Rozwiazania pozwalajace wydawcom decydowac, ktore boty maja dostep i na jakich warunkach, beda dojrzewac. Mozliwe, ze standardem stanie sie model, w ktorym dostep do tresci dla asystentow AI jest wyceniany lub rozliczany za realnie dostarczona odpowiedz, a nie za samo pobranie strony.

Po trzecie, strategia tresci. W swiecie, w ktorym pobor nie gwarantuje ruchu, wygrywac beda materialy, ktore modele chca cytowac, bo sa konkretne, wiarygodne i latwe do zacytowania. Ogolnikowe teksty, ktore asystent moze skompresowac do jednego zdania bez wskazania zrodla, strace na wartosci. Wyrazny punkt widzenia, dane wlasne i unikalna ekspertyza staja sie tarcza przed anonimizacja tresci w odpowiedziach AI.

Najblizsze miesiace pokaza, czy graczy o najgorszych wskaznikach uda sie sklonic do wiekszej wzajemnosci, czy tez wydawcy sami zaczna reglamentowac dostep. Jedno jest pewne: dane z lipca 2026 roku pokazuja, ze era, w ktorej crawler pobieral tresc i lojalnie odsylal uzytkownika, wlasnie ustepuje miejsca czemus zupelnie nowemu.

FAQ

Czym jest wskaznik crawl-to-referral?

To stosunek liczby podstron pobranych przez bota do liczby przekierowan, jakie ten bot odsyla z powrotem do wydawcy. Im wyzsza wartosc, tym mniej ruchu wraca do zrodla. Dla klasycznego Googlebota wynosi okolo 5 do 1, podczas gdy dla niektorych botow AI siega tysiecy pobran na jedno przekierowanie.

Ktora platforma ma najgorszy wskaznik i dlaczego to wazne?

Wedlug danych Cloudflare przywolanych w lipcu 2026 roku najgorszy wskaznik ma Anthropic (ClaudeBot), na poziomie okolo 11 122 do 1. Jest to o tyle istotne, ze w tym samym czerwcu udzial ClaudeBota w ruchu botow AI niemal sie podwoil do 19,8 procent, wiec gracz pobierajacy najwiecej oddaje najmniej ruchu.

Co te dane oznaczaja dla mojej strategii SEO?

Oznaczaja, ze sam pobor tresci przez boty AI nie przeklada sie na ruch. Warto przeniesc czesc uwagi na AIO, czyli optymalizacje pod cytowanie w odpowiedziach modeli, oraz monitorowac obecnosc marki w tych odpowiedziach. Klasyczne mierzenie sukcesu wylacznie liczba klikniec z organicznych wynikow przestaje oddawac pelny obraz widocznosci.

Czy rosnacy udzial crawlowania wyszukiwawczego to dobra wiadomosc?

Czesciowo tak. Crawle klasyfikowane jako wyszukiwanie wzrosly z 7,5 procent w kwietniu do 9,3 procent w maju. Ta kategoria ruchu sluzy odpowiadaniu na biezace pytania, a wiec ma wieksza szanse zakonczyc sie cytowaniem i przekierowaniem niz pobor sluzacy wylacznie trenowaniu modelu.

Czy moge zablokowac boty AI, ktore nie odsylaja ruchu?

Tak, dostep botow mozna ograniczac na poziomie pliku robots.txt oraz za pomoca narzedzi do zarzadzania crawlerami oferowanych przez dostawcow infrastruktury. Coraz wiecej wydawcow traktuje dostep botow AI jako zasob, ktory mozna reglamentowac lub wyceniac, zamiast udostepniac go bezwarunkowo.

Boty AI pobieraja tysiace stron na jedno przekierowanie. Nowe dane Cloudflare