Perplexity przestaje być tylko konsumencką wyszukiwarką AI i staje się pełnoprawnym, model-agnostycznym stosem dla deweloperów. W maju 2026 firma scaliła swoje produkty deweloperskie w cztery API: Agent API do wieloetapowych przepływów, Search API do retrievalu z weba w czasie rzeczywistym, Embeddings API do indeksowania wektorowego oraz Sandbox API (wkrótce w prywatnej becie) do izolowanego wykonywania kodu. To bezpośrednie wejście na rynek, na którym do tej pory dominowały OpenAI Assistants i ekosystem własnych integracji.
Pozycjonowanie jest jasne: jeden klucz API zamiast łączenia dostawcy modelu, warstwy wyszukiwania i bazy wektorowej. Dla zespołów SEO i AIO oznacza to nowy kanał, który w najbliższych miesiącach będzie zbierał ruch agentów odwiedzających Wasze strony i wybierających, kogo cytować.
Kontekst: jak Perplexity dochodził do statusu platformy
Jeszcze rok temu Perplexity było traktowane głównie jako alternatywa dla ChatGPT Search i nowy front w walce o wyszukiwarki AI. Już wtedy firma miała własny stack: nieujawnioną wersję wyszukiwarki webowej, parser treści i podsystem cytowań, który pojawia się w produktowych odpowiedziach na perplexity.ai. Aravind Srinivas wielokrotnie podkreślał, że ten retrieval to najcenniejszy element firmy, nie sam model.
Pierwsze publiczne udostępnienie Search API ruszyło wiosną. Agent API doszedł krótko potem, a w maju 2026 Perplexity poskładał wszystko w jedną ofertę API Platform: cztery komplementarne usługi z jednym billingiem, jedną dokumentacją i jasną propozycją dla deweloperów aplikacji opartych o AI.
To nie jest pivot. Konsumencka wyszukiwarka i subskrypcje Pro nadal generują główny strumień przychodów. Nowość polega na tym, że Perplexity celuje teraz w warstwę, której do tej pory nie chciał obsługiwać: hosting agentów innych firm, którzy używają wyszukiwarki Perplexity jako warstwy retrievalu pod własną aplikacją.
Kluczowe fakty
Wszystkie cztery API są dostępne pod jednym kluczem i jedną dokumentacją na docs.perplexity.ai. Poniżej szybkie zestawienie ról:
| API | Co robi | Status | Typowy use case |
|---|---|---|---|
| Agent API | Orkiestruje wieloetapowe workflowy: model przeszukuje web, wnioskuje, wywołuje narzędzia, weryfikuje fakty w kolejnych turach | GA | Asystenci research, monitoring konkurencji, agenci sprzedażowi |
| Search API | Real-time wyszukiwanie webowe z rankingiem, filtrowaniem domen, multi-query oraz ekstrakcją treści | GA | RAG, grounding LLM, fact-checking, agregatory |
| Embeddings API | Wektoryzacja tekstów pod retrieval na własnym korpusie | GA | Wewnętrzne bazy wiedzy, hybrydowy search |
| Sandbox API | Izolowane wykonywanie kodu wewnątrz workflowu agentowego | Wkrótce, private beta | Analiza danych, generowanie raportów, narzędzia agentów |
Najważniejszy element architektury, którego nie widać na pierwszy rzut oka, to fakt, że platforma jest model-agnostyczna. Agent API potrafi w jednym przebiegu wezwać dowolny z dostępnych modeli, korzystając z Multi-model Council Perplexity, a deweloper nie musi przepinać kluczy między dostawcami. Razem z Sandbox API daje to środowisko, w którym agent samodzielnie decyduje: czy doszukać brakujący fakt w sieci, czy uruchomić skrypt Pythona, czy zapytać model słabszy ale szybszy.
Search API: szczegóły, które robią różnicę
Search API zwraca rankowane wyniki webowe z ekstrakcją treści (a nie tylko snippety), wspiera filtrowanie po domenach, multi-query oraz parametry wpływające na świeżość. Dla zespołów budujących RAG-i to alternatywa wobec Bing Web Search API i własnych pipeline’ów na bazie scrapingu. Perplexity reklamuje „przejrzysty pricing per-query”, choć dokładne stawki ujawnia dopiero w konsoli po dodaniu metody płatności.
Agent API: orchestracja, której brakowało
Agent API ujmuje pętlę reasoning, search, tool-call, verify jako pojedyncze wywołanie API. Deweloper definiuje cel oraz dostępne narzędzia, a Perplexity prowadzi konwersację wewnętrznie aż do osiągnięcia odpowiedzi. To znaczy: nie trzeba ręcznie pisać warstwy stanu, retry, dedupe ani szyć w łatce promptów do „kontynuuj research”. Dla aplikacji typu deep research jest to skok jakości, którego pojedynczy strzał do LLM nie daje.
Co to znaczy dla SEO i AIO
Dotychczas rozmawialiśmy o Perplexity głównie jako o konsumenckiej wyszukiwarce AI: marka chce się tam pojawiać w cytowaniach, treść powinna być parseowalna, autorytet liczy się bardziej niż klasyczne linki. Teraz dochodzi druga warstwa: agenci budowani na Search API Perplexity będą codziennie pobierać Wasze treści i decydować, czy je cytować w wynikach swoich własnych użytkowników.
Z punktu widzenia content owner’a to znaczy trzy rzeczy:
- Ten sam ranking, dwa kanały konsumpcji. Perplexity Search API używa tej samej wyszukiwarki, co konsumencki Perplexity. Strony, które już są dobrze cytowane w panelu Perplexity, mają wysoką szansę być cytowane także w aplikacjach trzecich opartych o Search API. Inwestycja w widoczność w Perplexity zwraca się dwa razy.
- Agentowy traffic szybciej rośnie niż klikalny. Aplikacje agentowe robią więcej zapytań do API niż człowiek do panelu. Ruch botów Perplexity, mierzony w logach serwera, zacznie zauważalnie rosnąć. Monitoring user-agentów (PerplexityBot, Perplexity-User) staje się elementem analityki AIO, nie tylko technicznego SEO.
- llms.txt i parseowalność wracają do agendy. Agenci nie zatrzymują się na meta tagach. Im czystsza struktura, semantyczne nagłówki, listy zamiast prozy, tym wyższa szansa, że konkretny fragment zostanie wycięty jako „wniosek” przez Agent API w aplikacji innej firmy.
Jeśli zarządzacie projektem AIO, warto teraz dorzucić Perplexity Search API do testów regresyjnych obok ChatGPT Search i Google AI Mode. Zapytanie tym samym promptem przez Agent API daje stabilniejszy wynik niż klikanie po panelu, bo zwraca surowe linki w rankingu, a nie tylko końcową odpowiedź modelu.
Reakcje branży
Branża zareagowała na zapowiedź w dwóch dominujących tonach. Pierwsza grupa, deweloperzy aplikacji agentowych, wskazuje, że konsolidacja czterech komponentów (search, embeddings, sandbox, orkiestracja) pod jednym billingiem skraca time-to-prototype z tygodni do dni. To wpisuje się w trend, w którym OpenAI ze swoim Responses API i Anthropic z Claude Computer Use pchają deweloperów w stronę gotowych pętli zamiast ręcznego łączenia klocków.
Druga grupa, wydawcy oraz duże portale contentowe, patrzy na zmianę z większą rezerwą. Perplexity dotąd kojarzył im się z pojedynczym konsumenckim oknem, w którym ich treści są cytowane. Teraz każda aplikacja oparta o Search API w praktyce powtarza ten sam scenariusz, tylko na mniejszą skalę. To rodzi pytanie: czy umowa licencyjna Perplexity z wydawcą (rev share, kontrakty premium) obejmuje również zapytania trafiające do Search API, czy tylko konsumencki panel. W oficjalnej dokumentacji platformy ten temat jest jak na razie pominięty.
Polskie agencje, z którymi rozmawiałem nieformalnie w ostatnich dniach, traktują Search API jako pretekst do uporządkowania monitoringu cytowań. Każdy, kto już mierzył brand visibility w ChatGPT Search i AI Overviews, dorzuca po prostu trzecią kolumnę.
Pricing i dostępność
Perplexity reklamuje pricing per query oraz per orchestration step, ale konkretne stawki są widoczne po zalogowaniu w konsoli. Search API ma być zauważalnie tańszy od Bing Web Search w trybach z ekstrakcją treści, co potwierdzają nieoficjalne benchmarki opublikowane w społeczności deweloperów. Agent API rozlicza się od kroku, więc kosztowo opłaca się dla zadań, które bez orkiestracji wymagałyby kilkudziesięciu wywołań do osobnego LLM-a.
Wszystkie cztery API dostępne są globalnie, w tym z polskich adresów IP. Sandbox API rusza w prywatnej becie, zapisy idą przez formularz na docs.perplexity.ai.
Limity i throttling: co warto sprawdzić przed wdrożeniem
Z perspektywy zespołu produkcyjnego, kluczowe są trzy rzeczy, które trzeba przetestować zanim Search API trafi na ścieżkę krytyczną aplikacji. Po pierwsze, p95 latencji dla zapytań z włączoną ekstrakcją treści: w pierwszych pomiarach krąży on w okolicach 1.5 sekundy dla pojedynczego zapytania i potrafi sięgnąć 3 sekund dla zapytań multi-query rozkładanych na kilka domen. Po drugie, miękkie limity rate-limit są dostosowywane per konto w trybie samoobsługowym dopiero po kilku dniach historii. Po trzecie, niektóre domeny w polskim segmencie nie wracają z ekstrakcją treści, tylko z meta-snippetem, co warto wyłapać testem regresyjnym na 50 najważniejszych dla Was domenach.
Praktyczna rada wynikająca z testów: zapytanie Search API z parametrem freshness=day daje wyniki istotnie różne od domyślnego trybu, więc dla monitoringu cytowań marki warto te dwa tryby zbierać osobno i porównywać.
Jak wdrożyć monitoring widoczności w 60 minut
Najszybszy sposób przyzwyczajenia organizacji do nowego kanału to zbudowanie minimalnego pipeline’u monitoringu i pokazanie wyników stakeholderom. Schemat, który działa w naszych testach na polskim rynku:
- Zdefiniuj listę 30 zapytań brandowych i 30 zapytań rynkowych (np. „narzedzia SEO 2026”, „audyt techniczny SEO”, „monitoring AIO”).
- Uruchom Search API codziennie o stałej godzinie, zapisz top 10 domen wynikowych z każdej odpowiedzi.
- Dorzuć drugi przebieg z parametrem freshness=week, żeby zobaczyć, jak Perplexity reaguje na świeże publikacje.
- Dodaj trzeci przebieg z Agent API: ten sam prompt, ale w trybie „research and synthesize”, i loguj, które domeny są wymienione w treści odpowiedzi, nie tylko w cytowaniach.
- Po 14 dniach masz wystarczająco danych, by w dashboardzie pokazać udział własnej domeny vs konkurentów oraz dynamikę pojawiania się nowych źródeł.
To ten sam wzorzec, który zespoły mierzące widoczność w ChatGPT Search i Google AI Mode już znają. Różnica polega na tym, że dla Perplexity API platform pomiary są tańsze, deterministyczne i nie wymagają emulacji konsumenckiej przeglądarki.
Co to oznacza dla narzędzi SEO
Dla dostawców platform SEO (Ahrefs, Semrush, Sistrix, lokalni gracze) ta zmiana jest interesująca z dwóch powodów. Po pierwsze, mogą podpiąć Perplexity Search API jako tańszą alternatywę dla zapytań SERP w niektórych zastosowaniach: raportach pozycji, monitoringu marek, audytach widoczności. Po drugie, dostają nowy zestaw sygnałów do mierzenia: które domeny pojawiają się jako źródła w odpowiedziach Agent API, w jakim kontekście, w jakiej kolejności.
Można się spodziewać, że w ciągu kwartału na rynku pojawi się pierwszy raport typu „AI Citation Index” oparty wprost o Perplexity Search API, równolegle do istniejących raportów opartych o ChatGPT i Google AI Overviews. Dla zespołów AIO oznacza to nową kolumnę w dashboardzie i nowy KPI: udział w cytowaniach Perplexity Search.
Konkurencja: OpenAI, Google, Anthropic
OpenAI od miesięcy pcha rynek w kierunku platformy: Responses API, Assistants, Memory, Connectors. Anthropic z kolei stawia na Claude jako mózg agentów (Computer Use, MCP). Google idzie szlakiem Vertex AI i Gemini API. Każdy z tych graczy proponuje własny stos.
Perplexity nie próbuje konkurować ze wszystkim naraz. Świadomie zostawia warstwę modelu (jest model-agnostic, pod spodem siedzą m.in. Claude, GPT, Llama, własne fine-tuny) i koncentruje się na tym, czego nikt inny nie ma w wersji od pierwszego dnia gotowej do produkcji: dobrej, świeżej, rankowanej wyszukiwarki webowej z parserem treści. Sandbox API jest tu uzupełnieniem, nie głównym daniem.
Z punktu widzenia kupującego oznacza to nowy wzorzec wyboru: jeśli budujesz agenta, który bardzo dużo pyta web, Perplexity API platform może być najtańszym i najprostszym wyborem. Jeśli budujesz agenta wewnątrz korporacji, gdzie kluczowa jest integracja z systemami enterprise, OpenAI lub Anthropic z MCP zwykle wygrywa.
Co dalej
Realna data, której będą wypatrywać deweloperzy, to publiczna premiera Sandbox API. Po niej Perplexity ma kompletny stack pod złożone, długo działające agenty. Drugi wątek to integracja z konsumenckimi produktami: można zakładać, że to samo Agent API, które kupuje deweloper, zacznie napędzać „deep research” wewnątrz aplikacji Perplexity, znikając jako odrębny przycisk i stając się domyślnym sposobem działania.
Dla rynku SEO i AIO praktyczne kroki w najbliższym tygodniu są jasne: założyć konto na platformie, zrobić 100 zapytań Search API dla swojej marki i głównych konkurentów, zarchiwizować wyniki, porównać z tym, co widać w konsumenckim Perplexity. Jeśli wyniki różnią się drastycznie, sygnał jest mocny: zaczyna się tworzyć drugi front widoczności AI, który trzeba monitorować osobno.
Warto też wziąć udział w naszym przeglądzie systemów monitoringu, jeśli budujecie własny stack: monitoring cytowań w ChatGPT, Perplexity i Gemini opisuje konkretne narzędzia i schemat ich łączenia. Kontekstowo polecam też lekturę AI Citation Source Index 2026 z mapą domen, które najczęściej wpadają do odpowiedzi AI. Dla zespołów technicznych planujących RAG z Perplexity Search API pomocniczy będzie tekst o vector embeddings dla SEO.
FAQ
Czym Perplexity API platform różni się od OpenAI Responses API?
Perplexity stawia świeżą wyszukiwarkę webową jako fundament platformy i jest model-agnostyczny, więc Agent API może w jednym przebiegu zawołać GPT, Claude lub Llamę. OpenAI Responses API jest zamknięty na modele OpenAI i traktuje search jako opcjonalne narzędzie, nie rdzeń stosu.
Czy Search API Perplexity zastąpi Bing Web Search lub Google Custom Search?
Dla części zastosowań tak. Search API zwraca rankowane wyniki z ekstrakcją treści w jednym wywołaniu, co u konkurentów wymaga dodatkowych pipeline’ów. Dla zapytań ściśle geograficznych lub na rynki nieobsługiwane przez Perplexity klasyczne API od Microsoftu i Google nadal mają przewagę.
Czy moja strona pojawi się w wynikach Perplexity Search API automatycznie?
Tak, jeśli jest indeksowana przez wyszukiwarkę Perplexity. To ta sama warstwa, która zasila konsumencki panel, więc widoczność w jednym kanale przekłada się na widoczność w drugim. Można sprawdzić obecność testowym zapytaniem przez konsolę API.
Czy Agent API jest gotowy na produkcję, czy to wciąż beta?
Agent API ma status GA (general availability), Search API i Embeddings API również. Tylko Sandbox API jest w prywatnej becie. Producent reklamuje SLA i monitoring, choć w praktyce większość zespołów testuje go najpierw na niekrytycznych workflowach.
Jak mierzyć cytowania mojej marki w aplikacjach budowanych na Perplexity API?
Najprostszy schemat to cykliczne zapytania Search API z brand keywordami i monitoring listy domen w wynikach, plus logi serwera z user-agentami PerplexityBot i Perplexity-User. Dłużej grane, można wpiąć Agent API w pipeline raportowy i analizować, kiedy i w jakim kontekście Perplexity sięga po Wasze treści.
