Dwa typy agentów
Voice agent
Odbiera telefon, rozmawia po polsku, robi konkretne czynności:
- Recepcja gabinetu medycznego — odbiera 200 połączeń dziennie, rezerwuje wizyty, anuluje, podaje godziny otwarcia, ceny, kieruje do specjalistów. 70% spraw rozwiązuje samodzielnie, 30% przekazuje człowiekowi.
- Sprzedaż outbound — dzwoni do leadów, kwalifikuje, umawia spotkanie z handlowcem (po polsku, naturalnie).
- Customer support inbound — pierwsza linia obsługi reklamacji/pytań technicznych, eskalacja do działu jeśli sprawa nietypowa.
Stack: ElevenLabs Agents (priorytet — najlepszy polski głos) + Vapi.ai (alternative dla bardziej custom flow). Backend na Twilio dla numerów telefonicznych.
Chat agent
Pisze przez:
- Chat na stronie www (widget na klient.pl)
- WhatsApp Business API
- Slack/Teams (internal)
- E-mail (auto-reply na pytania)
Use cases:
- Customer support FAQ — odpowiada na 80% pytań z bazy wiedzy + dokumentacji + FAQ. Eskaluje do człowieka jeśli nie wie. Loguje wszystko do CRM.
- Internal HR/IT helpdesk — pracownicy pytają agenta o urlop, hasło, polityki — agent odpowiada z firmowej knowledge base.
- Sprzedażowy assistant — odpowiada na pytania pre-sales (cennik, demo, integracje) i kwalifikuje lead do handlowca.
- Onboarding nowego klienta — prowadzi przez setup self-service (wypełnia formularze, generuje dokumenty, planuje pierwszy call).
Stack: OpenAI Agent Builder / Anthropic Claude Skills / Microsoft Copilot Studio — wybór zależy od stacku klienta i wrażliwości danych.
Cena — od czego zależy
15–22k PLN — agent prosty: 1 use case (np. tylko recepcja, tylko FAQ), wbudowane w 1 platformę bez deep custom integration, 1-2 systemy backend.
25–40k PLN — agent średni: 2-3 use case (np. recepcja + przypomnienia + scheduling), custom prompts dla Waszej branży, RAG nad Waszymi dokumentami (200-500 stron knowledge base), integracje z 3-5 systemami.
45–80k PLN — agent zaawansowany: Multiple agents w orchiestracji (np. tier-1 FAQ → tier-2 specialist → human escalation), voice + chat hybrid, wdrożenie w środowisku regulowanym (banking, insurance) z extra compliance, custom voice training.
Czego nie robimy
- Nie trenujemy własnych modeli LLM — używamy gotowych (Claude, GPT, Gemini) z fine-tuningiem przez prompts i RAG. Trenowanie własnego modelu kosztuje $50k+ i nie ma sensu dla SMB.
- Nie deployujemy on-prem LLM — chyba że specjalna potrzeba (banking, healthcare). Wymaga AWS Bedrock / Azure OpenAI Service self-hosted — patrz Cloud AI.
- Nie obiecujemy 99% accuracy — żaden agent nie jest taki. Realnie 70-85% accuracy zależnie od domeny, plus eskalacja do człowieka dla reszty.
ROI typowo
Voice agent recepcji (35-osobowa sieć gabinetów):
- Przed: 2 recepcjonistki × 8h dziennie × 22 dni = 352 godzin/miesiąc
- Po: agent obsługuje 70% połączeń, recepcjonistki schodzą do 1 etatu
- Oszczędność: ~150 godzin/mo × 50 PLN = 7500 PLN/mo
- Koszt agenta: ~3000 PLN/mo (ElevenLabs subscription + retainer)
- Net: 4500 PLN/mo oszczędności = 54k PLN/rok
- ROI: wdrożenie 35k PLN / 54k rocznych oszczędności = ~8 miesięcy
Chat agent FAQ (80-osobowa hurtownia):
- Przed: 1 osoba w customer support odpowiada na 50 maili/dziennie, średnio 8 minut na odpowiedź
- Po: agent odpowiada na 65% maili, customer support skupia się na trudnych przypadkach
- Oszczędność: ~6 godzin/dziennie × 22 dni × 60 PLN/h = 7920 PLN/mo
- Koszt: ~1500 PLN/mo (OpenAI API + retainer)
- ROI: ~3-4 miesiące
Plan buildu (6–10 tygodni)
Tydzień 1–2 — Discovery & data prep
90-min kickoff. Audyt istniejącej knowledge base (FAQ, dokumenty, przykłady rozmów/maili). Definicja „personality” agenta — ton, formalność, zakres odpowiedzialności. Lista edge cases gdzie ma eskalować do człowieka.
Tydzień 3–5 — Build & training
Setup platformy (ElevenLabs Agent / Claude Skills / etc.). Prompt engineering (system prompt po polsku, few-shot examples, guardrails). RAG setup — embedding Waszej knowledge base, retrieval tuning. Integracje — CRM, kalendarz, baza klientów.
Tydzień 6 — Internal testing
100+ test conversations różnymi scenariuszami. Tuning prompts based on test results. Definicja escalation criteria — kiedy agent ma przekazać człowiekowi.
Tydzień 7–8 — UAT z klientem
Testowanie z 5-10 osobami z Waszego zespołu. Feedback loop — co agent robi źle, jak naprawić. Quality gate przed produkcją: 80% accuracy na test set.
Tydzień 9–10 — Production rollout
Stopniowy rollout (najpierw 10% ruchu, potem 50%, potem 100%). Live monitoring pierwszych 200 rozmów. Dashboard — co działa, co nie, gdzie eskalacja.
Hypercare i tuning
Pierwsze 30 dni: codzienny review 50 random rozmów (1h dziennie), tuning prompts na realnych przypadkach, co tydzień Loom video z postępami.
Po 30 dniach: retainer — typowo 5–10k PLN/mo dla agenta, co miesiąc raport accuracy + recommendations.
FAQ
Czy klient zorientuje się że to AI?
Trzeba sobie uczciwie powiedzieć: tak, jeśli rozmowa trwa >3 minuty, większość ludzi się orientuje. Voice agenci 2026 są bardzo dobre, ale nie perfekcyjne — pewne intonacje, brak wahania, „perfect grammar” zdradzają.
Polityka AIBRON: zawsze ujawniamy że to AI w pierwszych słowach rozmowy. „Cześć, tu Asystent głosowy AIBRON, czym mogę pomóc?” Klienci to akceptują dla rutyny (rezerwacje, FAQ). Dla emocjonalnych spraw (skargi, premium support) — od razu eskalacja do człowieka.
Czy agent może w ogóle działać off-line?
Nie. Wszystko przechodzi przez API LLM (OpenAI / Anthropic / Google). Wymagany internet i serwery dostawców LLM up. Uptime LLM dostawców 99.5–99.9%, więc kilka godzin downtime/rok się zdarzy.
Co z prywatnością rozmów?
Wszystko logowane (z zgodą klienta — dodajemy disclosure w pierwszych słowach). Logi zaszyfrowane. Retencja 90 dni domyślnie, dłużej tylko jeśli regulacja branżowa wymaga. Dane nie są używane do trenowania modeli LLM (Anthropic + OpenAI zero-retention DPA dla enterprise plans).
Co jeśli agent powie coś szkodliwego?
Mamy guardrails: system prompt zabrania konkretnych tematów (medical advice, legal advice, finansowe rekomendacje), klasyfikator pre-response przed wysłaniem odpowiedzi, escalation triggers jeśli klient pyta o coś poza zakresem. W praktyce 0% incydentów po dobrym setup. Zawsze pokażemy logi pierwszych 100 rozmów przed produkcją.