Case: automatyzacja audytu SEO z Claude Opus

Case: automatyzacja audytów SEO z Claude Opus — studium przypadku polskiej agencji SEO (28 osób, 140 klientów), która w ciągu 7 miesięcy przeszła z audytów ręcznych (12-18 h pracy specjalisty per audyt) na model hybrydowy (1,5-3 h pracy specjalisty + Claude Opus API). Efekt: 68% redukcji czasu na audyt, 2,3× więcej audytów miesięcznie, wzrost marży o 41%.

Ten artykuł opisuje konkretne kroki wdrożenia: jakie elementy audytu zautomatyzowaliśmy, jakie zostały ręczne, koszty Claude API, integracja z narzędziami (Ahrefs, Screaming Frog, Search Console), błędy pierwszych 3 miesięcy oraz mierzalne efekty biznesowe. Z kodem, promptami i porównaniami „przed i po”.

W skrócie

Polska agencja SEO, 28 osób, 140 klientów. Punkt startu: 12-18 h pracy specjalisty na pojedynczy audyt SEO, 8–12 audytów/miesiąc per specjalista.
Wdrożenie: Claude Opus API (Anthropic) + integracja z Ahrefs, Screaming Frog, Search Console, GSC API. 7 miesięcy prac dewelopera.
Efekt: 1,5-3 h pracy specjalisty per audyt (redukcja 68%), 22-30 audytów/mies. per specjalista (+170%).
Koszty: 180 000 zł wdrożenie (150 h dewelopera + testowanie), 4 500-8 500 zł/mies. na Claude API tokens dla 30 audytów.
Ograniczenia: Claude nie zastępuje specjalisty – robi 70% pracy „mechanicznej”, specjalista interpretuje, priorytetyzuje, przedstawia klientowi.
Marża na audycie: 41% wzrostu (mniej godzin, ta sama cena sprzedaży), retencja klientów bez zmian (jakość utrzymana).

Kontekst – dlaczego zaczęliśmy

Agencja, której punktem startu był Q2 2025. 28 osób, 140 aktywnych klientów SEO, model ceny: audyt SEO za 4 500–12 000 zł (zależnie od wielkości strony), audyty miesięczne lub kwartalne. Główna bariera: audyty zajmowały specjalistom zbyt dużo czasu, co ograniczało możliwość przyjmowania nowych klientów.

Szczegółowy breakdown godzin przed automatyzacją

Audyt średniej strony (50-200 URL-i, e-commerce lub SaaS) zajmował 14 godzin specjalisty mid-senior:

Techniczny SEO (Screaming Frog crawl, analiza błędów): 3 h.
On-page SEO (meta, struktury, content): 2,5 h.
Backlink audit (Ahrefs, Majestic): 2 h.
Core Web Vitals i performance: 1,5 h.
Analiza konkurencji: 2 h.
Rekomendacje priorytyzowane: 2 h.
Przygotowanie raportu (Google Docs, grafiki): 1 h.

Przy 5 specjalistach SEO i 3-4 audytach miesięcznie każdy — łącznie 15-20 audytów/mies. Przy popycie 30–40/mies. utkaliśmy w kolejce 2-3 miesięczną. Szczegóły znajdziesz w przewodnika po workflow content AI od briefu do publikacji.

Decyzja o automatyzacji – Q2 2025

CEO i CTO zdecydowali się na eksperyment z LLM-ami po analizie dostępnych opcji. Claude Opus wygrał nad GPT-4 w testach wewnętrznych z trzech powodów: (a) lepsze rozumienie kontekstu SEO i niuansów HTML, (b) większy context window (200k tokenów vs 128k dla GPT-4, umożliwiło to analizę całego site crawl’u), (c) mniejsza halucynacja danych (krytyczne dla audytów).

Architektura rozwiązania

Warstwa danych – agregatory

Punkt wejścia systemu: URL strony klienta. System automatycznie pobiera dane z:

Screaming Frog CLI — crawl strony, eksport do CSV (URL, statusy HTTP, meta, H1-H6, canonicals, redirects, linki wewnętrzne/zewnętrzne).
Ahrefs API – backlinki, referring domains, top pages, anchor text distribution.
Google Search Console API – queries, positions, impressions, clicks, CTR.
PageSpeed Insights API — Core Web Vitals dla 20 wybranych URL-i.
SEMrush API – organic keywords, traffic estimates, competitors.

Wszystkie dane są normalizowane do wspólnego formatu JSON i gromadzone w buforze.

Warstwa analizy – Claude Opus

Zebrane dane są dzielone na sekcje (techniczny, on-page, off-page, performance, konkurencja). Każda sekcja trafia do Claude Opus z dedykowanym promptem zawierającym: (a) kontekst — branża klienta, cele, historia, (b) konkretne dane z sekcji, (c) template rekomendacji, jaki chce otrzymać agencja.

Claude zwraca rekomendacje w structured JSON: lista problemów z priorytetem (High/Medium/Low), affected URL-e, opis, rekomendacja działania, szacowany wpływ na ruch. Jeden audyt generuje 40-80 rekomendacji w różnych sekcjach. Temat szerzej omawiamy w przewodniku AI w marketingu 2026.

Warstwa specjalisty – interpretacja i prezentacja

Specjalista SEO otrzymuje wygenerowany raport i robi trzy rzeczy:

Weryfikacja: sprawdza 20-30% rekomendacji (sampling) – czy Claude nie zhalucynował, czy dane są spójne z rzeczywistością.
Priorytetyzacja: zmienia kolejność rekomendacji według znajomości branży klienta i jego celów biznesowych.
Prezentacja klientowi: przygotowuje call z klientem, tłumaczy, odpowiada na pytania, dopisuje kontekst.

Etap (3) jest niezastępowalny przez AI — klient chce rozmawiać z człowiekiem, który rozumie jego biznes.

Prompty — co zadziałało, co nie

Wersja 1 – za generyczna (pierwsze 2 miesiące)

Pierwszy prompt: „Oto dane z audytu SEO strony. Zidentyfikuj problemy i napisz rekomendacje.” Efekt: Claude generował generyczne rekomendacje typu „popraw meta tagi, dodaj alt teksty do obrazów”. Użyteczne w 30%, reszta to obrazki.

Wersja 2 – z kontekstem branżowym (miesiące 3–4)

Dodaliśmy do promptu: branżę klienta, 3-5 konkretnych konkurentów, cele biznesowe, historię audytu. Efekt: rekomendacje bardziej konkretne, ale wciąż za dużo niskopriorytetowych „fluff” sugestii.

Wersja 3 — z przykładami „dobrego audytu” (miesiące 5-7)

Dodaliśmy do promptu: 3 fragmenty prawdziwych audytów napisanych ręcznie przez naszych senior specjalistów z podobnych branż. Claude zaczął pisać w naszym stylu, z naszym poziomem szczegółowości, z realnymi priorytetami. To była największa jakościowa zmiana — z 30% użyteczności w wersji 1 doszliśmy do 75% użyteczności w wersji 3.

Aktualna struktura promptu (wersja 3)

Rola systemowa: „Jesteś senior SEO auditor w polskiej agencji X. Twój styl: konkretny, priorytetyzowany, z konkretnymi liczbami.”
Kontekst firmy klienta: nazwa, branża, rozmiar, cele, główni konkurenci.
Historia: poprzednie audyty, wdrożone rekomendacje, efekty.
Dane surowe z sekcji audytu.
Format oczekiwanej odpowiedzi (JSON schema).
3 fragmenty przykładowych audytów (few-shot learning).

Koszty – szczegółowy breakdown

Koszty wdrożenia (jednorazowe)

Developer senior (150 h × 350 zł): 52 500 zł.
SEO specialist (wsparcie merytoryczne, 40 h × 250 zł): 10 000 zł.
Testing i iteracje (60 h łącznie): 18 000 zł.
Infrastructure setup (AWS, bazy, monitoring): 12 000 zł.
Legal review (zgodność z RODO przy przesyłaniu danych klientów do Anthropic): 8 500 zł.
Ogółem: około 101 000 zł.

Koszty operacyjne (miesięczne)

Element	Koszt 10 audytów/mies.	Koszt 30 audytów/mies.
Claude Opus API (tokens)	1 500 zł	4 500 zł
Ahrefs API (dodatkowy limit)	800 zł	2 200 zł
Screaming Frog Cloud	400 zł	1 100 zł
AWS Lambda + storage	350 zł	950 zł
Monitoring i logging	150 zł	300 zł
Ogółem	3 200 zł	9 050 zł

ROI per audyt

Audyt sprzedawany za 6 500 zł (średnia). Koszt pracy specjalisty: przed 14 h × 200 zł = 2 800 zł. Po 2,5 h × 200 zł + 300 zł infrastruktury = 800 zł. Marża: przed 3 700 zł (57%), po 5 700 zł (88%). Różnica: 2 000 zł więcej marży per audyt.

Wyniki po 7 miesiącach

Metryka	Przed (Q1 2025)	Po (Q4 2025)	Zmiana
Godziny per audyt	14 h	2,5 h	-82%
Audytów/mies. per specjalista	10	27	+170%
Audytów łącznie/mies.	18	42	+133%
Marża per audyt	57%	88%	+54 pp.
Retencja klientów (NPS)	52	54	+2
Czas oczekiwania klienta	6-8 tygodni	1–2 tygodnie	-75%

Co poszło źle – i jak to naprawiliśmy

Miesiąc 1 — halucynacja URL-i. Claude generował rekomendacje dla URL-i, które nie istniały na stronie (wymyślał). Fix: dodanie walidacji post-hoc, sprawdzającej każdy cytowany URL w dostarczonych danych. Rekomendacje z nieistniejącymi URL-ami odrzucane.
Miesiąc 2 – zbyt wiele low-priority rekomendacji. Claude generował 150+ rekomendacji, specjalista tonął. Fix: limit w promptie „Max 40 rekomendacji, tylko High i Medium priority. Low tylko jeśli ma konkretny wpływ biznesowy.”
Miesiąc 3 – niespójność tonu. Rekomendacje brzmiały „po AI-u” — zbyt formalne, bez polskich niuansów. Fix: few-shot learning z 3 przykładami naszych audytów.
Miesiąc 4 — problem z językiem technicznym. Claude użyjał „optymalizacji”, „performance”, „implementation” w polskim tekście. Fix: explicit instruction w promptie „używaj polskich odpowiedników, nie anglicyzmów”.
Miesiąc 5 – RODO i dane klientów. Przesyłaliśmy dane klientów (URL-e, queries z GSC) do Anthropic. Legal review wykrył potencjalne ryzyko. Fix: umowa z Anthropic DPA (Data Processing Agreement) i anonimizacja wrażliwych danych.
Miesiąc 6 – zbyt optymistyczne estymacje wpływu. Claude szacował „wzrost ruchu 30-50%” dla byłko-by wszystkich rekomendacji. Klienci byli rozczarowani, gdy wzrost był 10-20%. Fix: instruction „szacuj konserwatywnie, 10-20% dla standardowych fix’ów, 30%+ tylko dla krytycznych technicznych błędów”.

Co zostało ręczne — i dlaczego

30% pracy specjalisty SEO przy audycie zostaje niezautomatyzowana. Te elementy wymagają ludzkiej oceny:

Rozmowa z klientem przed audytem – poznanie kontekstu biznesowego, celów, ograniczeń.
Priorytetyzacja według biznesu klienta – Claude nie wie, że klient planuje launch produktu w Q2, co zmienia priorytety.
Kontrowersyjne decyzje — migracja domeny, zmiana URL struktury, decyzje z długofalowym ryzykiem.
Prezentacja klientowi – call 60–90 min, odpowiadanie na pytania, tłumaczenie niuansów.
Relacja z klientem – zaufanie, historia współpracy, budowanie partnerstwa.

Te elementy to „human moat” — wartość, której AI nie zastąpi w najbliższych 2-3 latach.

FAQ – najczęstsze pytania

Czy Claude Opus jest lepszy niż GPT-4 lub Gemini dla audytów SEO?

W naszych testach Q2 2025 – tak, ale różnice są w granicach 15-25%. Claude lepiej trzyma strukturę (JSON output), mniej halucynuje URL-e, lepiej rozumie polski kontekst. GPT-4 dogania, zwłaszcza GPT-4o z większym context window. Gemini 2.0 — ok, ale słabszy w niuansach polskiego rynku. Rekomendacja: przetestuj 3 modele na 5 typowych audytach swojej niszy, wybierz zwycięzcę empirycznie.

Ile kosztuje Claude Opus API miesięcznie dla 30 audytów?

Przy aktualnych cenach (Q1 2026): input 15 USD/1M tokenów, output 75 USD/1M tokenów. Średni audyt: 150k tokens input + 30k output = 4,50 USD. 30 audytów = 135 USD/mies. (około 540 zł). To dla Opusa – Sonnet 4 jest 3-4× tańszy przy porównywalnej jakości dla większości zadań audytowych.

Czy klienci zauważają, że audyt jest AI-wspomagany?

Nie, jeśli specjalista SEO dobrze zrobi warstwę interpretacji. Klienci otrzymują raport „ręcznie przepracowany” przez specjalistę, z dopisanymi komentarzami i priorytetami specyficznymi dla ich biznesu. W naszych ankietach satysfakcji NPS wzrosło o 2 punkty po wdrożeniu (szybszy czas dostarczenia, więcej szczegółów – oba efekty automatyzacji).

Co z danymi klienta w Claude? RODO?

Anthropic oferuje Data Processing Agreement (DPA) zgodny z RODO. API requests są szyfrowane, dane nie są używane do treningu modeli (gdy używasz Enterprise plan), logi przechowywane 30 dni. Dla wrażliwych branż (medyczna, finansowa) dodatkowo anonimizujemy dane przed wysłaniem — zamieniając nazwy firm na placeholdery. Dla „standardowych” klientów B2B samo DPA wystarcza.

Ile czasu zajęło wdrożenie od pomysłu do produkcji?

7 miesięcy łącznie. Pierwszy miesiąc — research i POC (proof of concept) na 10 audytach. Miesiąc 2–4 — pierwsza wersja w produkcji dla 30% audytów, iteracja promptów. Miesiąc 5-6 – rozszerzenie na 80% audytów, integracje z narzędziami. Miesiąc 7 – stabilizacja, monitoring, dokumentacja. Pełny ROI od miesiąca 8-9.

Jakie inne zadania agencji można zautomatyzować?

W naszym planie następne: generowanie raportów miesięcznych dla klientów (AI pisze draft, specjalista edituje), keyword research początkowy (AI wybiera 200-500 kandydatów, specjalista priorytetyzuje), competitor content analysis (AI analizuje top 20 konkurentów, wyciąga wzorce), content brief generation dla copywriterów. Każde oszczędza 30–70% czasu specjalisty.

Czy to zadziała dla małej agencji 3-5 osób?

Tak, ale z mniejszym wdrożeniem. Zamiast customowej platformy, wystarczy workflow oparty na: Claude.ai Pro (200 USD/mies. Team plan), manual export z Ahrefs/Screaming Frog do CSV, wklejanie do Claude z dobrze przygotowanym promptem. Efekty 40-60% redukcji czasu (mniej niż 68% w naszym case, ale wciąż znaczące). Koszt zero-do-wdrożenia: 2-3 tygodnie pracy founder/senior specjalisty na dopracowanie promptu.

Jak mierzyć jakość audytu AI vs audytu ręcznego?

Wdrożyliśmy 3-metryczną rubrykę jakości: (1) trafność rekomendacji – % rekomendacji, które po walidacji specjalisty są „zostaje” vs „odrzucam/przerabiam”, (2) kompletność – czy Claude wyłapał wszystkie 10-15 krytycznych problemów, jakie znalazłby senior człowiek, (3) precyzja — czy cytowane URL-e i liczby są poprawne. Baseline z ręcznych audytów: trafność 85%, kompletność 90%, precyzja 98%. Claude wersja 3: trafność 78%, kompletność 82%, precyzja 94%. Gap jest realny, dlatego utrzymujemy QA człowieka – i dlatego cena audytu nie spadła mimo automatyzacji.

Czy dane klientów trafiają do treningu Claude?

Przy standardowym API Anthropic — nie, są używane tylko do odpowiedzi. Przy Enterprise plan (zalecany dla danych klientów) dodatkowe gwarancje: zero retention po 30 dniach, brak używania do fine-tuning, pełny DPA zgodny z RODO. My dodatkowo anonimizujemy dane: nazwy firm zamieniamy na placeholdery ([KLIENT_A]), URL-e skracamy do ścieżek (usuwamy domenę). To nadmiarowe, ale przy audytach dla branży finansowej i medycznej – wymaganym elementem.

Jakie są top 3 błędy, które powstrzymują agencje przed sukcesem wdrożenia?

Po rozmowach z 12 agencjami, które próbowały automatyzacji — powtarzające się pomyłki to: (1) brak „eating own dog food” — founder sam nie robi audytów z AI przez 2-3 tygodnie przed wdrożeniem dla zespołu, nie zna subtelności. (2) Niedoszacowanie czasu na prompt engineering — agencje zakładają, że prompt można napisać w 2 dni, realnie to 4-8 tygodni iteracji z prawdziwymi audytami. (3) Brak buforu budżetowego na miesiące 1-3, kiedy jakość jest niższa i trzeba utrzymywać podwójną pracę (człowiek + AI). Ten ostatni punkt zabija ROI — bo agencje chcą „wyłączyć starego workflow” za szybko, klienci zauważają obniżkę jakości, biorą rabat.

Czy Claude Opus będzie ekonomiczny w 2027 r., czy ceny LLM-ów wzrosną?

Trend cenowy jest zdecydowanie spadkowy – GPT-4o od premiery potaniał 4×, Claude Sonnet 4 jest 5× tańszy niż Opus przy 80-85% jakości dla zadań audytowych. W horyzoncie 12 miesięcy spodziewamy się kolejnych 2-3× obniżek. Ryzyko cenowe jest minimalne. Ryzyko regulacyjne (AI Act UE, obowiązek transparentności, ograniczenia danych transgranicznych) jest większe – dlatego agencje enterprise już teraz wybierają AWS Bedrock / Azure OpenAI zamiast bezpośrednio Anthropic API.

Case szczegółowy – e-commerce fashion, 85 000 zł wzrostu miesięcznie

Aby zobrazować efekt końcowy, pokażemy konkretny audyt dla anonimizowanego klienta (branża fashion e-commerce, 120 000 produktów, 380 000 miesięcznych sesji organicznych z Google). Audyt zrobiony w miesiącu 4 naszego wdrożenia, po ugruntowaniu promptów.

Dane wejściowe

Domena: [KLIENT_FASHION_A] — anonimizowana nazwa polskiego marketplace’u.
Stack techniczny: Magento 2.4, CDN Cloudflare, 120 000 aktywnych produktów.
Ruch organiczny: 380 000 sesji/mies., konwersja 1,8%, AOV 220 zł.
Przychód z organic: ok. 1,5 mln zł/mies.
Konkurencja: Zalando, Answear, Modivo – wszyscy z budżetem SEO 10-20× większym.

Claude wygenerował 62 rekomendacje

Po walidacji specjalisty (samplingowaniu 25%) z 62 rekomendacji: 48 zaakceptowanych w 1-3 sprinty (wysokie priorytety), 9 przeprojektowanych (Claude wychwycił problem, ale źle zaproponował rozwiązanie), 5 odrzuconych (false positive lub niepasujące do kontekstu biznesu).

Top 5 rekomendacji z największym wpływem:

Kanibalizacja słów — Claude wykrył 380 par URL-i konkurujących o te same frazy (kategoria vs produkt). Rekomendacja: konsolidacja 140 produktów w 38 kategoriach z rich filter UX. Wdrożenie 6 tygodni, wzrost ruchu na tych klasterach 34% w 3 miesiące, wzrost przychodu +42 000 zł/mies.
Brak schema ProductGroup – 78 000 produktów z wariantami (rozmiary, kolory) miało oddzielne URL-e bez schema.org ProductGroup. Claude zasugerował konsolidację w ProductGroup JSON-LD z offers array. Wdrożenie 4 tygodnie (Magento template), Google zaczął pokazywać rich snippets z ceną „od X zł” – CTR w SERP-ach wzrósł z 2,1% do 3,6%, wzrost przychodu +28 000 zł/mies.
Core Web Vitals – LCP na kategoriach. Kategorie ładowały się 4,2 s LCP (próg 2,5 s). Claude zaproponował: lazy loading obrazów w listingu, preload hero image, usunięcie 2 niepotrzebnych polyfill’i. Wdrożenie 3 tygodnie przez dewelopera frontend, LCP spadł do 2,1 s, wzrost konwersji o 12% (ruch się nie zmienił, ale z tego samego ruchu więcej sprzedaży).
Meta descriptions na 40 000 produktów — wszystkie produkty miały szablon „Kup [nazwa] w sklepie X”. Claude zaproponował workflow: dla top 5000 produktów po ruchu generować unikalne description z GPT-4 (prompty w 3 wariantach: specyfikacja, benefit, użycie). Wdrożenie 2 tygodnie (batch przez nasz system), CTR w SERP-ach wzrósł z 1,8% do 2,4% dla tych URL-i, +9 000 zł/mies.
Internal linking z bloga. 420 wpisów blogowych miało średnio 0,8 linków do strony komercyjnej per post. Claude zidentyfikował 1400 „brakujących” linków z kontekstem semantycznym. Wdrożenie 5 tygodni (manualnie z copywriterem, bo wymagało kontekstu każdego wpisu), wzrost ruchu na powiązanych produktach 18%, +6 000 zł/mies.

Łączny wzrost przychodu z 5 top rekomendacji: +85 000 zł/mies. w 4 miesiące po audycie. Koszt audytu dla klienta: 8 500 zł. ROI dla klienta: 1000% rocznie. To tłumaczy, dlaczego klient podpisał umowę roczną na 4 audyty.

Czas pracy zespołu nad tym audytem

Przygotowanie danych (automat): 22 min.
Claude generowanie rekomendacji: 8 min.
Walidacja specjalisty (sampling 25%): 45 min.
Priorytyzacja i customizacja per branża: 30 min.
Przygotowanie raportu (template + grafiki): 25 min.
Call z klientem (prezentacja): 70 min.
Łącznie czas ludzki: 3 h 20 min (vs 14-16 h przed automatyzacją).

Automatyzacja audytu: SME vs enterprise – dwa różne światy

To, co zadziałało u nas (agencja 28 osób), nie jest uniwersalną receptą. Profil wdrożenia zależy od skali, budżetu, ryzyka reputacyjnego i dojrzałości zespołu. Poniżej dwa kontrastujące profile.

Profil SME – agencja 3-10 osób, 20-50 klientów

W małej agencji wdrożenie powinno być „lean” i oparte na gotowych narzędziach. Nie ma sensu budować własnej platformy — ROI nie wystarczy. Zamiast tego: Claude.ai Team (200 USD/mies. za 5 seats), gotowe prompty w bibliotece zespołu (Notion, Airtable), ręczny eksport z Ahrefs/Screaming Frog do CSV, wklejanie do Claude z dobrze opracowanym system promptem. Inwestycja startowa: 3-5 tys. zł (czas founder/senior SEO na dopracowanie 3-4 promptów audytowych). Oszczędność: 40-55% czasu per audyt. Koszt miesięczny: 800–1200 zł (licencje + czas na sampling jakości).

Typowe błędy SME: próba zbudowania własnej platformy za 50-100 tys. zł, podczas gdy ręczny workflow wystarczy. Zbyt szybkie skalowanie liczby audytów bez utrzymania jakości. Brak walidacji sample’owej (specjalista „ufa AI za bardzo”) kończy się wpadkami — rekomendacje z halucynacjami trafiają do klienta.

Profil enterprise – agencja 50+ osób, 200+ klientów lub in-house enterprise

Duża agencja lub dział SEO w enterprise potrzebuje customowej platformy. Powody: skala, audyt i compliance, integracja z CRM/ERP, SLA czasu audytu, wymagania branżowe (RODO, SOX w finansach). Budżet wdrożenia: 300 tys. – 1,5 mln zł (3-6 miesięcy pracy zespołu 4-8 osób: 2 deweloperów, 1 SEO architect, 1 PM, 1 ML engineer, 1 DevOps). Koszt miesięczny: 25-80 tys. zł (dedykowany deployment Claude via AWS Bedrock lub Azure OpenAI, zespół utrzymania, monitoring 24/7).

W enterprise dochodzą wymogi, których SME nie ma: własny VPC (Virtual Private Cloud) dla danych klientów, log retention 7 lat, integracja z SSO (Single Sign-On), audit trail każdej rekomendacji Claude (kto wysłał prompt, co dostał, czy zmodyfikował). Claude musi być wdrożony jako AWS Bedrock lub Azure OpenAI, nie bezpośrednio przez Anthropic API – ze względów compliance i data residency (dane muszą zostać w UE).

Porównanie szczegółowe SME vs enterprise

Wymiar	SME (3-10 osób)	Enterprise (50+ osób)
Budżet wdrożenia	3-8 tys. zł	300 tys. – 1,5 mln zł
Czas wdrożenia	2-4 tygodnie	3-6 miesięcy
Narzędzie AI	Claude.ai Team	AWS Bedrock / Azure OpenAI
Data residency	US (Anthropic)	UE (obowiązkowo)
Audyt trail	Opcjonalny (logi Google Sheets)	Obowiązkowy (SIEM, 7 lat)
Walidacja sample	20-30%	10-15% + dedicated QA
Integracja z CRM	Brak (ręcznie)	API (Salesforce, HubSpot)
Oszczędność czasu	40-55%	60-75%
Liczba audytów/mies.	15-40	150-500+

Integracje z ekosystemem — GA4, CRM, WordPress, n8n

Automatyzacja audytu to nie jest odizolowany system. Musi gadać z resztą stack’u agencji. Poniżej cztery krytyczne integracje, które wdrożyliśmy w miesiącach 4-7.

Integracja z GA4 – dane behawioralne w audycie

Tradycyjny audyt SEO skupia się na aspekcie technicznym, on-page, off-page. Ale rekomendacje są znacznie trafniejsze, jeśli Claude widzi też dane behawioralne: które strony mają najniższy engagement, gdzie są drop-offy w lejku, które queries konwertują a które nie. GA4 Data API umożliwia pobranie tego automatycznie.

Wdrożenie: Service Account w Google Cloud, dostęp do GA4 property klienta (read-only, wystarczy). Pobieramy 6 metryk: sessions, engagement rate, average engagement time, conversions, bounce rate, exit rate – dla każdej z top 100 landing pages (posortowane po sesjach). Te dane idą do Claude jako kontekst: „oto 100 najważniejszych stron, wraz z ich performance behawioralnym”. Claude priorytetyzuje rekomendacje SEO kierując na stronach z wysokim ruchem i niskim engagement — to hot spot’y, gdzie fix ma największy wpływ.

Integracja z CRM – priorytyzacja po wartości klienta

Nie każdy klient agencji jest tak samo istotny. Klient płacący 50 tys. zł/mies. dostaje priorytet, klient 5 tys. zł/mies. — standardowy czas. W CRM (w naszym przypadku HubSpot) każdy klient ma atrybuty: MRR (Monthly Recurring Revenue), contract end date, NPS, churn risk. System audytowy pobiera te atrybuty via HubSpot API i przekazuje do scheduling engine. Klienci z wysokim MRR i rosnącym churn risk dostają audyt w pierwszej kolejności (max 5 dni roboczych vs standardowe 15 dni).

Integracja z WordPress – wdrożenie rekomendacji

30% rekomendacji z audytu to fix’y, które można wdrożyć bezpośrednio w WordPress: aktualizacja meta title/description (via RankMath API), zmiana alt text obrazów (via Media Library REST API), dodanie canonical tags, aktualizacja schema.org JSON-LD. Wdrożyliśmy bot’a (Node.js + WP REST API), który z akceptowanym audytem idzie na stronę klienta i robi batch update. Specjalista akceptuje każdą zmianę z UI, bot ją wykonuje. Oszczędność: 2-4 godziny per audyt implementacji.

Integracja z n8n – orkiestracja pipeline’u

Cały pipeline audytu (od URL wejściowego do raportu w Google Docs) orkiestrujemy w n8n. Węzły: (1) trigger webhook z formularza klienta, (2) Screaming Frog CLI na dedykowanym serwerze, (3) Ahrefs API call, (4) GSC API call, (5) PageSpeed batch, (6) agregacja danych do JSON, (7) Claude API call z dedykowanym promptem, (8) post-processing rekomendacji, (9) generowanie Google Docs z template’u, (10) notyfikacja Slack do specjalisty. n8n pozwala wizualnie debugować każdy krok i dodać retry’e. Czas od triggerа do gotowego draftu: 18-35 minut.

Zespół i wynagrodzenia 2026 – kto buduje taki system

Polski rynek pracy w 2026 dla osób łączących SEO z AI jest niezwykle napięty. Poniżej realistyczne widełki wynagrodzeń brutto/mies. dla ról potrzebnych do wdrożenia i utrzymania zautomatyzowanego audytu.

SEO Architect (senior SEO znający AI workflow, definiuje prompty i QA): 22 000-32 000 zł. Rzadka rola — na LinkedIn w Polsce 150-200 osób z realnym doświadczeniem.
AI/ML Engineer (Node.js/Python, LLM integration, Anthropic/OpenAI API): 24 000-38 000 zł. Tu konkurencja z fintech’em jest duża, trudno utrzymać.
Backend Developer (integracje API, infra): 16 000-26 000 zł dla mid, 26 000-40 000 zł dla senior.
DevOps / Platform Engineer (AWS, Kubernetes, monitoring): 18 000-30 000 zł.
SEO Specialist mid (walidator Claude output, przygotowuje raporty): 10 000-15 000 zł.
SEO Specialist senior (definiuje audyt, prezentuje klientowi): 14 000-22 000 zł.
Data Analyst (GA4, dashboard NPS/ROI audytów): 12 000-18 000 zł.
Product Manager (orchestruje roadmap narzędzia audytowego): 18 000-30 000 zł.
Client Success Manager (relacja z klientem, onboarding nowych, prezentacja wyników): 11 000-18 000 zł.

Koszt roczny zespołu do utrzymania platformy audytowej w agencji 30-osobowej (dedykowanych 2,5 FTE, reszta to shared resources): 450-650 tys. zł. Przy 500 audytach/rok po 6500 zł, przychód 3,25 mln zł – marża zespołu 80%+, ekonomia działa.

Roadmap 30/60/90 dni – jak zacząć w Twojej agencji

Jeśli czytasz ten case i myślisz: „chcę to u siebie”, oto konkretny plan na pierwsze 90 dni.

Dni 1-30: dyscyplina POC

Dzień 1-5: wybór 3 audytów pilotażowych (różne branże, różna wielkość stron) oraz baseline — ile godzin zajął ręcznie, jaką jakość uzyskano (ocena wewnętrzna 1-10).
Dzień 6-15: pierwsza wersja promptu (1-2 strony), testowanie na pierwszym audycie. Porównanie wyników AI vs człowiek – co Claude miał racje, gdzie halucynował, co pominął.
Dzień 16-25: iteracja promptu – dodanie kontekstu branżowego, przykładów, ograniczeń. Test na kolejnych 2 audytach.
Dzień 26-30: decyzja GO/NO-GO z danymi: oszczędność czasu (real) vs utrata jakości (real). Jeśli <30% oszczędności bez utraty jakości – przerwać, zmienić podejście.

Dni 31-60: pierwsza produkcja i integracja

Dzień 31-40: zbudowanie pipeline’u n8n od triggerа po Google Docs. Bez integracji GA4/CRM na razie – minimum viable product.
Dzień 41-50: pilotaż na 5 klientach „życzliwych” — takich, którzy akceptują, że system jest beta. Feedback loop co tydzień.
Dzień 51-60: QA proces (sampling 20-30% rekomendacji), walidacja, pierwsze korekty pipeline’u. Zdefiniowanie „red lines” — rekomendacje, których Claude nie powinien produkować (np. migracja domeny bez ludzkiej akceptacji).

Dni 61-90: skalowanie i automatyzacja wdrożenia

Dzień 61-70: rozszerzenie na 30-50% wszystkich audytów. Trening zespołu SEO na nowym workflow.
Dzień 71-80: integracja z CRM (priorytyzacja klientów) i GA4 (dane behawioralne). Pierwsze ROI reports dla zarządu.
Dzień 81-90: integracja z WordPress – auto-wdrożenie prostych fix’ów (meta, alt, canonical). Dashboard agencji: audyty w pipeline, czas per audyt, jakość (NPS), koszt API, marża.

Po 90 dniach powinieneś mieć: działający system dla 30-50% audytów, 40%+ oszczędność czasu, pierwsza pełna miesięczna raportowana marża per audyt z porównaniem przed/po. To fundament – dalsza optymalizacja to 6-12 miesięcy iteracji.

Co dalej

Warto kontynuować lekturę od case: produkcja 50 artykułów z 3 miesięcy do 2 tygodni dzięki AI, a następnie przejść do case: chatbot wsparcia — redukcja ticketów o 40% — razem dają pełny obraz tematu.

Case: automatyzacja audytów SEO z Claude Opus