Google ignoruje llms.txt: 97% plików bez zapytań

Plik llms.txt, reklamowany przez ostatni rok jako bilet wstępu do odpowiedzi generowanych przez sztuczną inteligencję, okazuje się w praktyce dokumentem, którego prawie nikt nie czyta. Z analizy Ahrefs opartej na 137 210 domenach wynika, że 97 procent opublikowanych plików llms.txt nie otrzymało w maju 2026 roku ani jednego zapytania. W tym samym tygodniu John Mueller z Google publicznie potwierdził, że wyszukiwarka tego formatu nie używa i że nie ma on żadnego wpływu na pozycje w wynikach.

Kontekst: skąd wziął się llms.txt i dlaczego budził nadzieje

Standard llms.txt zaproponowano pod koniec 2024 roku jako prostą odpowiedź na problem, który wydawał się oczywisty. Skoro modele językowe coraz częściej streszczają i cytują treści ze stron, to może warto dać im gotową, uporządkowaną mapę witryny w czytelnym formacie Markdown. Pomysł zakładał, że plik umieszczony w katalogu głównym domeny (na wzór robots.txt) wskaże asystentom AI najważniejsze podstrony, opisze strukturę serwisu i pomoże modelom trafniej rozumieć kontekst.

Branża SEO podchwyciła koncepcję błyskawicznie. W ciągu kilkunastu miesięcy powstały generatory plików, wtyczki do popularnych systemów CMS oraz całe poradniki obiecujące, że llms.txt to nowy fundament optymalizacji pod wyszukiwarki oparte na AI. Format wpisał się idealnie w narrację o GEO (Generative Engine Optimization) i AEO (Answer Engine Optimization), czyli o rzekomo nowych dyscyplinach, które miały zastąpić klasyczne SEO. Problem w tym, że entuzjazm wyprzedził dowody. Nikt nie sprawdził, czy modele faktycznie te pliki pobierają.

Teraz takie dane wreszcie się pojawiły, i są bezlitosne.

Warto przypomnieć, że llms.txt od początku był propozycją oddolną, a nie standardem firmowanym przez któregokolwiek z dużych dostawców wyszukiwania czy modeli językowych. To istotna różnica wobec robots.txt, który respektują praktycznie wszystkie liczące się crawlery, oraz wobec sitemap.xml, który Google i Bing oficjalnie wspierają od lat. llms.txt nigdy nie doczekał się takiego wsparcia. Żaden z czołowych dostawców AI nie zadeklarował, że pobiera ten plik i traktuje go jako wiążącą wskazówkę. W praktyce oznaczało to, że cała koncepcja opierała się na założeniu, iż popyt wytworzy podaż, czyli że skoro witryny zaczną masowo publikować pliki, to modele w końcu nauczą się z nich korzystać. Dane Ahrefs pokazują, że ten mechanizm nie zadziałał.

Kluczowe fakty: co pokazała analiza Ahrefs

Zespół Ahrefs przeanalizował logi serwerowe za pośrednictwem własnych narzędzi Web Analytics oraz Bot Analytics. Wzięto pod uwagę 137 210 domen, które w maju 2026 roku notowały realny ruch. Sprawdzano, czy pod adresem /llms.txt zwracany jest kod HTTP 200 oraz czy plik jest prawdziwym dokumentem Markdown, a nie stroną błędu udającą zawartość. Wyniki układają się w jeden, jednoznaczny obraz.

Wskaźnik	Wartość
Przeanalizowane domeny z ruchem	137 210
Domeny z prawidłowym plikiem llms.txt	28 procent (38 360)
Pliki bez ani jednego zapytania (maj 2026)	97 procent
Pliki, które dostały jakikolwiek ruch	około 3 procent (ok. 1100 domen)
Udział botów w zapytaniach o plik	96 procent
Udział ludzi (głównie specjaliści SEO)	4 procent
Udział botów wyszukiwawczych AI (AI retrieval)	1,1 procent

Najciekawsze jest jednak rozbicie tego niewielkiego ruchu, który w ogóle istnieje. Okazuje się, że plików llms.txt prawie nie odwiedzają realne asystenty AI. Zamiast nich dominują narzędzia do audytu i skanery.

Narzędzia do audytu SEO: 21,7 procent
Niezidentyfikowane boty: 14,9 procent
Ogólne crawlery webowe: 13,1 procent
Narzędzia profilujące technologie: 11,6 procent
Agenci AI i infrastruktura agentowa: 10,5 procent
Skanery GEO/AEO: 5,8 procent
Crawlery trenujące modele AI: 5,3 procent
Boty mapujące występowanie llms.txt: 3,6 procent
Asystenci AI: 2,5 procent
Boty pobierające treść na potrzeby odpowiedzi (AI retrieval): 1,1 procent

Innymi słowy: większość i tak znikomego ruchu generują narzędzia, które sprawdzają, czy plik w ogóle istnieje, a nie systemy, które wykorzystują jego zawartość do budowania odpowiedzi. Zsumowane kategorie ściśle związane z AI (agenci, crawlery treningowe, asystenci, boty retrieval) dają mniej więcej jedną piątą wszystkich odwołań. Reszta to audyt, profilowanie i ruch automatyczny niezwiązany z generatywną sztuczną inteligencją.

Ahrefs zwrócił też uwagę na coś, co ostatecznie podważa sens całej koncepcji. Żaden bot AI nie próbował pobrać nieistniejącego pliku llms.txt na domenach, które go nie miały. Spośród zapytań kończących się błędem 404 aż 98 procent pochodziło od ludzi ręcznie wpisujących adres. Modele po prostu nie szukają tego pliku z własnej inicjatywy.

Co powiedział Google

Stanowisko wyszukiwarki dopełnia obrazu. John Mueller, Senior Search Analyst w Google, w komentarzu cytowanym przez branżowe serwisy stwierdził wprost, że llms.txt nie służy do rankowania i że format ten nie powstał z myślą o wyszukiwaniu. Mueller określił plik jako rodzaj tymczasowej protezy, która być może pozwala zaoszczędzić nieco tokenów narzędziom do programowania opartym na AI, ale nie ma nic wspólnego z tym, jak Google ocenia i pozycjonuje strony.

To istotne rozróżnienie. Google konsekwentnie powtarza, że standardem dla SEO pozostaje HTML, a nie dodatkowe pliki Markdown. Wyszukiwarka renderuje i indeksuje normalne strony, a funkcje generatywne, takie jak AI Overviews i AI Mode, korzystają z tej samej infrastruktury indeksowania. Osobny plik z listą adresów niczego tu nie zmienia. Co więcej, wcześniejsza analiza obejmująca 300 000 domen nie wykazała żadnej korelacji między posiadaniem llms.txt a liczbą cytowań w odpowiedziach AI.

Jak sprawdzić sytuację u siebie

Wnioski z badania łatwo przełożyć na własny serwis, bo nie wymagają drogich narzędzi. Pierwszym krokiem jest sprawdzenie, czy plik w ogóle istnieje: wystarczy wejść pod adres domena.pl/llms.txt i zobaczyć, czy zwraca treść, czy stronę błędu. Drugim krokiem jest zajrzenie do logów serwera lub do raportów crawlerów, jeśli korzystamy z narzędzi monitorujących boty. Tam, gdzie plik istnieje, niemal zawsze zobaczymy ten sam wzorzec opisany przez Ahrefs: pojedyncze odwołania od skanerów i narzędzi audytowych oraz brak realnego ruchu od systemów AI budujących odpowiedzi.

Jeśli interesuje nas faktyczna widoczność w wyszukiwarkach generatywnych, znacznie więcej powie raport generatywnej AI w Search Console, który Google zaczął udostępniać wybranym witrynom. Pokazuje on wyświetlenia w AI Overviews i AI Mode, czyli dane oparte na realnym indeksie, a nie na osobnym pliku Markdown. To dobry punkt wyjścia, by ocenić, czy treści są w ogóle wykorzystywane przez funkcje generatywne, niezależnie od tego, czy serwis ma llms.txt, czy nie.

Co to znaczy dla SEO i AIO

Najważniejszy wniosek jest taki, że llms.txt nie jest dziś kanałem dystrybucji treści do modeli językowych. Jeżeli ktoś wdrożył ten plik z nadzieją na większą widoczność w ChatGPT, Perplexity czy Gemini, dane Ahrefs mówią jasno, że realny zwrot z tej inwestycji jest bliski zeru. To nie znaczy, że plik szkodzi pozycjom w Google (Mueller potwierdził, że jest neutralny), ale znaczy, że czas i budżet wydane na jego utrzymywanie nie przekładają się na efekt.

Z perspektywy AIO, czyli optymalizacji pod silniki generatywne, kluczowa lekcja brzmi: widoczność w odpowiedziach AI budują te same czynniki, które od lat decydują o klasycznym SEO. Modele i tak pobierają treść z normalnie zaindeksowanych stron HTML, więc liczy się jakość i jednoznaczność treści, czytelna struktura nagłówków, poprawne dane strukturalne, autorytet domeny oraz to, czy strona w ogóle jest dostępna dla crawlerów. Dokładnie te same fundamenty opisaliśmy w naszym słowniku AIO na 2026 rok.

Warto też zauważyć szerszy kontekst. Skoro 96 procent zapytań o llms.txt pochodzi od botów, to wpisuje się to w trend, który opisywaliśmy przy okazji danych o ruchu maszynowym: boty po raz pierwszy generują więcej ruchu niż ludzie. Pliki llms.txt są dziś raczej obiektem zainteresowania automatów audytujących niż narzędziem realnej komunikacji z asystentami AI.

Pojawia się również argument bezpieczeństwa. Autorzy badania zwracają uwagę, że publikowanie dodatkowego pliku z uporządkowaną mapą treści zwiększa powierzchnię ataku, w tym ryzyko prób wstrzykiwania poleceń (prompt injection) do systemów, które taki plik zinterpretują. W połączeniu z brakiem mierzalnych korzyści prowadzi to do wniosku, że w obecnym stanie rzeczy wady przeważają nad zaletami.

Trzeba też uczciwie odnotować, czego badanie nie mówi. Niskie zainteresowanie plikiem nie dowodzi, że treści danej witryny nie trafiają do modeli. Wręcz przeciwnie: trafiają, tylko inną drogą, czyli przez normalne indeksowanie i pobieranie stron HTML przez crawlery wyszukiwarek i dostawców AI. llms.txt nie jest więc tym, co decyduje o obecności w odpowiedziach generatywnych, i jego brak niczego nie blokuje. To rozróżnienie bywa mylone w poradnikach, które sugerują, że bez pliku model nie zobaczy serwisu. Dane pokazują coś odwrotnego: model i tak czyta zwykłe strony, a osobny plik jest dla niego w najlepszym razie obojętny.

Reakcje branży

Wnioski Ahrefs odbiły się szerokim echem, bo uderzają w jedną z najgłośniej promowanych taktyk ostatniego roku. Część specjalistów przyjęła dane z ulgą, traktując je jako koniec mody napędzanej bardziej marketingiem narzędzi niż dowodami. Inni przypominają, że standardy sieciowe potrzebują czasu, by się przyjąć, i że niski poziom adopcji wśród modeli nie musi być stanem trwałym.

Pojawiają się też głosy nieco bardziej zniuansowane. Część firm wskazuje, że plik llms.txt bywa użyteczny w wąskim zastosowaniu, na które zwrócił uwagę sam Mueller, czyli jako podpowiedź dla narzędzi programistycznych opartych na AI, które dzięki niemu mogą szybciej zorientować się w strukturze dokumentacji technicznej. To jednak zupełnie inne zastosowanie niż obiecywana widoczność w wyszukiwarkach generatywnych dla zwykłych witryn contentowych.

Ciekawym wątkiem jest też sama skala adopcji. Skoro aż 28 procent przebadanych domen opublikowało plik llms.txt, to znaczy, że format trafił do mainstreamu szybciej niż realne dowody na jego skuteczność. To pokazuje, jak silnie branżą rządzi obawa przed przegapieniem nowego trendu. Wystarczyła sugestia, że plik może pomóc w widoczności w AI, by setki tysięcy witryn wdrożyły go na wszelki wypadek. Dane Ahrefs są w tym sensie zdrową korektą, bo zamieniają domysły na liczby i pozwalają podejmować decyzje na podstawie tego, co faktycznie się dzieje na serwerach, a nie na podstawie marketingowych obietnic.

Dyskusja wpisuje się w szerszą debatę o tym, czym właściwie jest optymalizacja pod AI. Google już wcześniej studziło zapał wokół nowych skrótów, przypominając w oficjalnych wytycznych, że AEO i GEO to wciąż SEO, a manipulowanie cytowaniami w odpowiedziach AI podlega tym samym zasadom antyspamowym co reszta wyszukiwania. Historia llms.txt wygląda na kolejny rozdział tej samej opowieści: rynek szuka magicznego przełącznika, którego nie ma.

Co dalej

Czy llms.txt zniknie? Niekoniecznie od razu. Format jest tani we wdrożeniu i neutralny dla rankingu, więc wiele serwisów po prostu zostawi istniejące pliki w spokoju. Trudno jednak oczekiwać, by w najbliższych miesiącach stał się on realnym kanałem dotarcia do modeli, dopóki najwięksi dostawcy AI nie zaczną go aktywnie pobierać i wykorzystywać. Na razie żaden z nich tego nie robi w skali, która miałaby znaczenie.

Dla zespołów contentowych i specjalistów SEO praktyczny plan działania jest dziś dość prosty. Po pierwsze, nie warto traktować llms.txt jako priorytetu ani obiecywać klientom widoczności w AI dzięki samemu wgraniu pliku. Po drugie, jeśli plik już istnieje i jest aktualny, nie ma powodu go usuwać, ale nie należy go też ręcznie rozbudowywać kosztem ważniejszych prac. Po trzecie, energię lepiej skierować na to, co faktycznie działa: silne, dobrze ustrukturyzowane treści, poprawne dane strukturalne, dostępność dla crawlerów oraz budowanie autorytetu marki, którą modele będą cytować, bo znajdą ją w normalnym indeksie.

Najbliższe tygodnie pokażą, czy któryś z dostawców generatywnej AI zdecyduje się oficjalnie wesprzeć format i nadać mu realne znaczenie. Do tego czasu dane mówią same za siebie: llms.txt to plik, którego prawie nikt nie czyta, a wyszukiwarka, dla której rzekomo powstał, w ogóle go nie używa.

FAQ

Czym jest plik llms.txt?

To dokument w formacie Markdown umieszczany w katalogu głównym domeny (na wzór robots.txt), który miał wskazywać modelom językowym najważniejsze podstrony i strukturę serwisu. Założenie było takie, że ułatwi asystentom AI rozumienie i cytowanie treści. W praktyce, jak pokazują dane Ahrefs, modele prawie w ogóle go nie pobierają.

Czy llms.txt wpływa na pozycje w Google?

Nie. John Mueller z Google jednoznacznie potwierdził, że wyszukiwarka nie używa llms.txt do rankowania i że format nie powstał z myślą o wyszukiwaniu. Plik jest neutralny: nie pomaga i nie szkodzi pozycjom. Standardem dla SEO pozostaje HTML.

Ile plików llms.txt faktycznie czytają systemy AI?

Bardzo niewiele. W analizie 137 210 domen 97 procent plików nie dostało w maju 2026 roku ani jednego zapytania. Z ruchu, który w ogóle wystąpił, 96 procent pochodziło od botów, a boty wyszukiwawcze AI (AI retrieval) odpowiadały zaledwie za 1,1 procent odwołań.

Czy powinienem usunąć istniejący plik llms.txt?

Nie ma takiej konieczności, bo plik jest neutralny dla rankingu. Nie warto jednak inwestować czasu w jego rozbudowę ani obiecywać sobie dzięki niemu większej widoczności w AI. Trzeba też pamiętać o argumencie bezpieczeństwa, ponieważ dodatkowy plik z mapą treści zwiększa powierzchnię ataku, w tym ryzyko prób prompt injection.

Na czym więc skupić się w optymalizacji pod AI?

Na fundamentach, które od lat decydują o SEO: jakości i jednoznaczności treści, czytelnej strukturze nagłówków, poprawnych danych strukturalnych, dostępności dla crawlerów oraz autorytecie domeny. Modele pobierają treść z normalnie zaindeksowanych stron HTML, więc to one, a nie osobny plik, decydują o widoczności w odpowiedziach generatywnych.

Google ignoruje llms.txt: 97 procent plików nie dostaje ani jednego zapytania