CNN dołącza do frontu wydawców walczących z silnikami AI Search. Sieć informacyjna złożyła w czwartek 28 maja 2026 r. pozew przeciwko Perplexity AI w sądzie federalnym w Nowym Jorku, zarzucając startupowi nielegalne kopiowanie treści, omijanie pliku robots.txt oraz reprodukowanie fragmentów artykułów chronionych paywallem. To jeden z najmocniejszych jak dotąd ruchów dużej redakcji wobec firmy budującej tzw. answer engine, czyli wyszukiwarkę odpowiedzi opartą o modele językowe.
Sprawa zapada w newralgicznym momencie dla branży SEO i AIO. Google domyka właśnie May 2026 Core Update, AI Overviews docierają już do 2,5 miliarda użytkowników miesięcznie, a wydawcy obserwują dwucyfrowe spadki CTR w segmencie zapytań informacyjnych. Pozew CNN to nie tylko spór o prawa autorskie, ale też sygnał, że licencjonowanie treści dla LLM staje się fundamentem nowego ekosystemu wyszukiwania.
Co zarzuca CNN i jaki jest stan faktyczny
Według doniesień serwisu Storyboard18 oraz The Verge, pozew został złożony w czwartek 28 maja 2026 r. w Southern District of New York. CNN twierdzi, że Perplexity bez zgody pobrało i przetworzyło setki artykułów redakcji, a następnie zaserwowało użytkownikom odpowiedzi zawierające, jak ujmuje to pozew, near-verbatim excerpts (fragmenty niemal dosłowne) wygenerowane po wpisaniu samych nagłówków materiałów CNN.
W skardze pojawiają się cztery kluczowe wątki:
- Reprodukowanie istotnych fragmentów tekstów, w tym treści chronionych subskrypcją CNN Plus i paywallem.
- Ignorowanie technicznych prób blokady crawlerów, w tym konfiguracji robots.txt oraz nagłówków serwerowych.
- Kontynuowanie pobierania materiałów po fiasku negocjacji licencyjnych prowadzonych w 2025 roku.
- Nieuprawnione użycie znaków towarowych CNN w kontekście, który mógł sugerować autoryzację treści przez redakcję.
CNN domaga się odszkodowania finansowego oraz permanent injunction, czyli stałego zakazu sądowego dalszego wykorzystywania jego dziennikarstwa. Pozew został przygotowany przez kancelarię reprezentującą wcześniej duże podmioty medialne w sporach z platformami technologicznymi. Według publicznych informacji to pierwszy raz, gdy duża amerykańska sieć telewizyjna staje na drodze sądowej przeciwko firmie z segmentu generative search.
Reakcja Perplexity i argument o faktach
Perplexity, jak podaje The Verge cytowane przez Storyboard18, nie zamierza ustępować. Rzecznik startupu Jesse Dwyer skomentował sprawę jednym zdaniem: You can’t copyright facts. Stanowisko firmy sprowadza się do tezy, że odpowiedzi generowane przez silnik to syntetyczne podsumowania zdarzeń, a nie kopia konkretnych artykułów, więc nie naruszają prawa autorskiego do oryginalnej formy ekspresji.
Linia obrony znana jest z wcześniejszych spraw. W pozwie Dow Jones i New York Post z 2024 r. Perplexity argumentowało, że jego model przetwarza fragmenty na własne sformułowania, a pozwy wydawców traktowało jako próbę dławienia konkurencji technologicznej. Eksperci prawa autorskiego studzą jednak optymizm startupu, zwracając uwagę, że reprodukowanie zdań w niemal niezmienionej formie, zwłaszcza treści ukrytych za paywallem, nie mieści się w doktrynie fair use, którą Perplexity próbuje przywołać.
Kluczowe fakty w pigułce
| Element | Szczegół |
|---|---|
| Powód | Cable News Network (CNN), Warner Bros. Discovery |
| Pozwany | Perplexity AI, Inc. |
| Sąd | Southern District of New York |
| Data złożenia | 28 maja 2026 r. |
| Główne zarzuty | naruszenie praw autorskich, omijanie zabezpieczeń technicznych, naruszenie znaków towarowych, bezpodstawne wzbogacenie |
| Żądane środki | odszkodowanie, stały zakaz sądowy, ujawnienie zakresu kopiowania |
| Materiał dowodowy | fragmenty near-verbatim z artykułów CNN po wpisaniu nagłówków do Perplexity |
| Precedens | New York Times v OpenAI, Dow Jones v Perplexity, Reddit v Perplexity |
Dlaczego to ważne dla SEO i AIO
Pozew CNN przyspiesza proces, który toczy się od dwóch lat: ekosystem wyszukiwania dzieli się na zamknięty i licencjonowany. Z jednej strony OpenAI, Google i Microsoft podpisują wielomilionowe umowy z wydawcami (Axel Springer, News Corp, Le Monde, FT, Reuters, AP). Z drugiej, część firm AI próbuje skalować się szybciej niż konkurencja, korzystając z otwartego web. Każdy kolejny pozew zwiększa koszt drugiej strategii.
Dla specjalistów SEO i AIO oznacza to kilka rzeczy:
- Pliki robots.txt i meta robots ponownie zyskują na znaczeniu, nawet jeśli AI Search ignoruje je w praktyce. Bez ich konfiguracji wydawca traci mocny argument procesowy.
- Strona, która chce być cytowana w odpowiedziach LLM, musi udostępniać jasny, retrieval-friendly fragment z autorskim spojrzeniem. Suche fakty łatwiej parafrazować bez atrybucji.
- Wartość unikatowych analiz, danych własnych i wywiadów rośnie. Silnik AI nie zacytuje cudzych liczb, jeśli ma swoje, ale prawie zawsze wskaże źródło tam, gdzie pojawia się oryginalne badanie.
- Marki, które dotąd nie traktowały paywalla jako narzędzia, zaczynają je traktować jako element strategii AIO. Treść za logowaniem to jednocześnie sygnał ekskluzywności i tarcza prawna.
Dla porównania, jak wpływa to na widoczność w odpowiedziach AI, warto śledzić niezależne benchmarki dostawców LLM. Pisaliśmy o tym kontekście w analizie udziałów ChatGPT, Gemini i Perplexity w ruchu AI oraz w omówieniu dashboardu AEO Sensor od HubSpot, który monitoruje zmienność cytowań w trzech głównych silnikach.
Co mówi pozew o technikach scrapingu
Najmocniejszy punkt skargi CNN to nie samo kopiowanie, ale sposób jego prowadzenia. Według redakcji Perplexity miało korzystać z user-agentów innych niż jego oficjalny PerplexityBot, rotować adresy IP oraz korzystać z usług pośredniczących, by ominąć blokady. Identyczny zarzut postawiły wcześniej Forbes oraz Wired w głośnej publikacji z 2024 r., w której dziennikarze pokazali, że Perplexity sięgało po treści z artykułów oznaczonych jako noindex i niedostępnych dla domyślnych crawlerów.
Z punktu widzenia SEO ten wątek może być prawnie najbardziej kosztowny. W amerykańskim prawie omijanie technicznych zabezpieczeń dostępu do treści podlega Computer Fraud and Abuse Act oraz Digital Millennium Copyright Act, a sankcje są surowsze niż za samo naruszenie copyright. To wyjaśnia, dlaczego ostatnie pozwy wydawców kładą tak duży nacisk na warstwę techniczną, a nie na samą jakość parafrazy.
Reakcje branży
News Media Alliance, organizacja zrzeszająca 2200 wydawców prasowych w USA, opublikowała tego samego dnia oświadczenie wspierające CNN, w którym wzywa Kongres do uregulowania zasad treningu modeli językowych na cudzej publicystyce. Po stronie technologicznej zabrał głos między innymi szef Cloudflare, który ponownie przypomniał, że jego firma od marca 2026 r. udostępnia tzw. AI Audit dla wydawców, czyli warstwę kontroli ruchu botów AI.
W Polsce sprawa rezonuje przede wszystkim wśród redakcji i agencji obsługujących duże portale informacyjne. Izba Wydawców Prasy w 2025 r. ostrzegała, że problem dotyczy też mniejszych redakcji branżowych, których treści masowo trafiają do baz treningowych bez żadnej kompensaty. Pozew CNN może wpłynąć na sposób, w jaki polskie wydawnictwa konstruują kolejne wezwania do zaprzestania scrapingu.
Z perspektywy specjalisty SEO interesujący jest też kontekst regulacyjny w UE. AI Act wprowadza obowiązek dokumentowania zbiorów treningowych dla modeli ogólnego przeznaczenia, a Code of Practice z 2025 r. nakłada na dostawców obowiązek respektowania mechanizmów opt-out wydawców. Jeśli CNN wygra, podobne argumenty łatwiej będzie podnosić w europejskich sporach.
Co dalej z Perplexity i rynkiem answer engines
Według dostępnych informacji Perplexity nie ma jeszcze wyznaczonego terminu odpowiedzi na pozew, ale po publicznych komentarzach Aravinda Srinivasa, CEO firmy, można spodziewać się ostrego sporu prawnego rozciągniętego na wiele kwartałów. W tle toczy się też runda finansowania, w której Perplexity ma być wyceniane powyżej 18 miliardów dolarów. Inwestorzy będą uważnie obserwować, jak ten i pokrewne pozwy wpływają na ścieżkę monetyzacji.
Trzy scenariusze są najbardziej prawdopodobne:
- Szybka ugoda i umowa licencyjna podobna do tej zawartej między OpenAI a Axel Springer. Plus dla obu stron, minus dla niezależnych wydawców, którym ciężej będzie ustalać własne warunki.
- Wieloletni proces precedensowy. Wyrok ustali granice fair use dla syntetycznych odpowiedzi LLM i może otworzyć drogę do pozwów zbiorowych ze strony mniejszych redakcji.
- Hybryda. Perplexity wprowadza nowy program publisher rev-share, jednocześnie walcząc o oczyszczenie modelu z odpowiedzialności za retrospektywne kopiowanie sprzed wprowadzenia opt-out.
Bez względu na scenariusz, jedno jest pewne: zasady gry w AI Search zmieniają się szybciej niż kiedykolwiek. Specjaliści, którzy wdrażają strategie AIO, powinni już teraz aktualizować swoje briefy redakcyjne, dokumentować źródła, ustawiać sygnały atrybucji i monitorować, w jakim kontekście marka cytowana jest w odpowiedziach LLM. Praktyczny przewodnik na ten temat znajdziecie w naszym opracowaniu o pięciu zmianach w sposobie linkowania źródeł przez Google AI Overviews.
Kontekst rynkowy: kto już pozwał Perplexity
CNN nie jest pierwsze. Lista podmiotów, które od 2024 r. weszły z Perplexity w spór sądowy lub publiczną wymianę pism procesowych, robi wrażenie.
| Powód | Data | Status |
|---|---|---|
| Dow Jones, New York Post | październik 2024 | w toku |
| The New York Times (cease and desist) | listopad 2024 | nie przerodziło się w pozew |
| październik 2025 | w toku | |
| Wiley | luty 2026 | w toku |
| CNN | maj 2026 | nowy |
Po stronie OpenAI lista pozwów jest podobnie długa, lecz odmienna w charakterze. NYT pozywa OpenAI od grudnia 2023 r., a sprawa wciąż nie weszła w fazę dowodową na temat zakresu treningu. Wniosek dla rynku: pozwy są długie, kosztowne i niepewne, ale ich liczba sama w sobie tworzy presję regulacyjną.
Wpływ na strategie wydawnicze w Polsce
Redakcje w Polsce muszą odpowiedzieć sobie na trzy pytania. Po pierwsze, czy chcą licencjonować treści dostawcom LLM, a jeśli tak, to na jakich warunkach finansowych i technicznych. Po drugie, czy ich CMS umożliwia precyzyjne sterowanie dostępem dla botów AI, w tym osobne reguły dla treści premium i open. Po trzecie, jak będą mierzyć efekt obecności w AI Search, skoro klasyczne CTR i sesje organiczne tracą na adekwatności.
Dobrym punktem startowym jest audyt logów serwera pod kątem identyfikacji botów GPTBot, PerplexityBot, Google-Extended, Claude-Web oraz Bytespider, a następnie świadoma decyzja, które z nich blokujemy, a które chcemy puścić w ramach kalkulacji ekspozycji marki. Polecamy nasz materiał o nowym podejściu Google do AEO i GEO, w którym pokazujemy, jak nie wpaść w pułapkę nadprodukcji plików llms.txt bez realnego wpływu na widoczność.
Co robić w najbliższych tygodniach
Dla zespołów SEO, content i legal w wydawnictwach i firmach mediowych, działania na czerwiec 2026 r. są jasne:
- Zaktualizować robots.txt i meta robots, dodać User-agent: PerplexityBot z Disallow lub Allow zgodnie ze strategią.
- Przejrzeć Terms of Service strony pod kątem klauzul zakazujących trenowania modeli AI bez umowy licencyjnej.
- Wdrożyć monitoring botów na poziomie WAF lub CDN, by mieć materiał dowodowy w razie sporu.
- Ustalić wewnętrzny proces zgody na licencjonowanie treści dla dostawców LLM.
- Edukować redakcję i autorów, że jakość, autorski głos i dane własne są jedyną realną przewagą w erze syntetycznych odpowiedzi.
To dobry moment, aby zrewidować KPI dla widoczności w AI Search. Nie chodzi już tylko o ruch, lecz o markę jako źródło cytowane. Pozew CNN przyspiesza moment, w którym sygnał silnik mnie cytuje stanie się równie ważny, co pozycja w top 3 Google.
Pytania, na ktore CNN bedzie musialo odpowiedziec
Mimo silnej pozycji wyjsciowej CNN nie ma sprawy z gory wygranej. Sad bedzie wymagal odpowiedzi na kilka technicznych pytan, ktore w sporach dotyczacych LLM nadal pozostaja otwarte. Po pierwsze, w jakim stopniu artykuly CNN faktycznie znalazly sie w zbiorze treningowym Perplexity, a w jakim w warstwie retrieval, czyli odswiezanego w locie indeksu sieciowego. Granica jest istotna, bo skutkuje innym profilem odpowiedzialnosci.
Po drugie, sad zbada, czy CNN sygnalizowal Perplexity blokade w sposob jednoznaczny. Tu wchodza w gre nie tylko robots.txt, ale rowniez Terms of Service, formalne wezwania do zaprzestania naruszen oraz parametr X-Robots-Tag. Po trzecie, ile faktycznie zarobil Perplexity na zapytaniach, w ktorych pojawily sie tresci CNN. To pytanie ekonomiczne, ktore decyduje o wysokosci ewentualnego odszkodowania, szczegolnie w warunkach modelu subskrypcyjnego Perplexity Pro i Perplexity Max.
Dla zewnetrznego obserwatora najciekawsze beda dowody techniczne dolaczone do skargi. CNN dolaczyl screen po screenie zapytan w Perplexity z porownaniem do oryginalnego artykulu. Jesli sad uzna, ze duplikacja jest znaczaca, otworzy droge do roszczen wszystkich wydawcow majacych zbierane podobnie tresci. To moze byc moment, w ktorym presja prawna z pozwow przelozy sie na powszechne wdrozenie publisher API i platforma platnosci na rzecz redakcji.
Podsumowanie
Pozew CNN przeciwko Perplexity AI to nie pojedyncze starcie redakcji ze startupem. To kolejny element procesu, w którym branża wyszukiwania porządkuje zasady gry między wydawcami a modelami językowymi. Dla specjalistów SEO i AIO sygnał jest jednoznaczny: licencjonowanie i atrybucja będą filarami nowego ekosystemu, a praca nad widocznością w AI Search wymaga już dziś świadomych decyzji w zakresie crawlingu, polityki publikacji i monitoringu cytowań.
Czy CNN może wygrać sprawę z Perplexity AI?
Trudno przewidzieć wynik, ale pozew CNN jest mocno udokumentowany dowodami technicznymi, w tym przykładami reprodukowania fragmentów treści zza paywalla. Sądy USA w sprawach przeciwko OpenAI dopuściły już większość zarzutów do dalszego procedowania, więc CNN ma realne szanse na precedensowy wyrok lub korzystną ugodę.
Co to oznacza dla małych wydawców i blogerów?
Małe redakcje raczej nie pójdą do sądu, ale skorzystają na precedensie. Im więcej dużych spraw, tym chętniej dostawcy LLM uregulują dostęp do treści przez wspólne licencje. W praktyce już dziś warto zaktualizować robots.txt, monitorować boty AI i traktować swoją unikalną perspektywę jak najcenniejszy zasób.
Czy powinienem zablokować PerplexityBot na stronie?
To decyzja strategiczna. Blokada oznacza utratę szansy na cytowanie i ruch z odpowiedzi Perplexity, ale chroni treści premium i daje mocniejszy argument w ewentualnym sporze. Najczęstsze rozwiązanie kompromisowe to udostępnienie streszczeń i nagłówków, a blokada treści za paywallem oraz materiałów eksperckich.
Jak monitorować, czy moja marka jest cytowana przez LLM?
Można skorzystać z narzędzi takich jak AEO Sensor od HubSpot, Profound, Otterly, czy zbudować własny monitor na bazie API OpenAI, Anthropic i Perplexity, regularnie pytając modele o słowa kluczowe związane z marką i analizując odpowiedzi pod kątem obecności linków i wzmianek.
Czy AI Act w Europie zmieni sytuację?
Tak, częściowo. AI Act i Code of Practice 2025 nakładają na dostawców modeli ogólnego przeznaczenia obowiązek respektowania opt-outów oraz dokumentowania źródeł treningowych. W UE wydawcy mają lepsze podstawy prawne do wezwań o zaniechanie naruszeń niż w jurysdykcjach poza Europą.
