
Prawnik nagrywa konsultację. Lekarz rozmawia z pacjentem. Księgowy robi spotkanie z klientem. Potem trzeba to przepisać na tekst. Transkrypcja AI robi to za Ciebie w minuty zamiast godzin.
Koszt: od 0,30 zł za minutę przy modelu rozliczeniowym "pay per minute" do 2 500 zł miesięcznie w nieograniczonym pakiecie.
Setup wdrożenia: 3 000 - 20 000 zł jednorazowo.
Widełki cenowe
| Model rozliczenia | Cena |
|---|---|
| Pay per minute - proste | 0,30 - 0,60 zł/min |
| Pay per minute - z diarization (rozpoznawanie mówców) | 0,60 - 1,50 zł/min |
| Pakiet do 50 godzin miesięcznie | 500 - 1 000 zł |
| Pakiet unlimited | 1 500 - 2 500 zł |
Setup integracji z Twoimi systemami: 3 000 - 20 000 zł jednorazowo.
Setup - co wpływa na cenę
### Zakres integracji
Tylko plik audio do tekstu. Najprostsze. 3 000 - 5 000 zł setup.
Integracja z Microsoft Teams. Transkrypcja spotkań Teams automatycznie po zakończeniu. Podsumowanie AI z kluczowymi punktami. 5 000 - 10 000 zł setup.
Integracja z Zoom. Analogicznie do Teams. 5 000 - 10 000 zł setup.
Integracja z systemem rezerwacji (dla klinik). Transkrypcja wizyty, wypełnianie karty pacjenta, integracja z eZdrowie. 15 000 - 25 000 zł setup.
Custom workflow. Np. transkrypcja rozmowy sprzedażowej, automatyczne wypełnianie CRM, scoring leada. 10 000 - 20 000 zł setup.
### Wymagania językowe
Język polski z regionalnym akcentem: wymaga Whisper large-v3 albo Bielik STT. Lekko droższe niż angielski.
Branża medyczna (terminologia): model dostrojony pod terminologię medyczną. +2 000 - 5 000 zł do setup.
### Jakość transkrypcji
Podstawowa (90% dokładność): tani model, krótki postprocessing. Wysoka (95%+): lepszy model, AI postprocessing, korekta błędów. Legal-grade (98%+): audit human review, dodatkowy koszt.
Model pay per minute vs pakiet
Prosta matematyka pomaga wybrać.
Pay per minute przy 0,80 zł/min: - 10 godzin miesięcznie = 480 zł - 30 godzin = 1 440 zł - 50 godzin = 2 400 zł
Pakiet 50 godzin za 800 zł miesięcznie: - Przy 10h: ale 800 zł (przepłacasz) - Przy 30h: 800 zł zamiast 1 440 zł (oszczędzasz 44%) - Przy 50h: 800 zł zamiast 2 400 zł (oszczędzasz 66%)
Break-even: pakiet zaczyna się opłacać od 15-20 godzin miesięcznie. Powyżej 40 godzin unlimited jest oczywistym wyborem.
Miesięczne koszty utrzymania
| Element | Koszt miesięczny |
|---|---|
| Hosting (jeśli prywatne AI) | 500 - 1 500 zł |
| API Whisper / model STT | 100 - 800 zł |
| Monitoring | 100 - 300 zł |
| Wsparcie techniczne | 200 - 800 zł |
Razem: 900 - 3 400 zł miesięcznie (dodatkowo do kosztu per minutę).
Przykłady z rynku
Kancelaria prawna, 8 prawników. Nagrywanie konsultacji, transkrypcja z podziałem na mówców (prawnik / klient), automatyczne streszczenie. Setup: 12 000 zł. Miesięcznie (40h transkrypcji): 800 zł.
Klinika medyczna, 15 lekarzy. Transkrypcja wizyt, automatyczne wypełnianie karty pacjenta. Prywatne AI (Bielik STT dla polskiego). Setup: 22 000 zł. Miesięcznie (80h transkrypcji): 1 800 zł.
Biuro rachunkowe, 12 pracowników. Spotkania z klientami, wyciąganie zaleceń z rozmów, zapis w CRM. Setup: 8 000 zł. Miesięcznie (25h): 600 zł.
Co zyskujesz dokładnie
Czas. Godzina rozmowy to 4-6 godzin ręcznego przepisywania. Transkrypcja AI robi to w 5-10 minut.
Dokładność. Ludzie zapominają detale po rozmowie. AI zapisuje każde słowo i można wrócić do konkretnego momentu.
Compliance. W branżach regulowanych (prawo, medycyna) zapis rozmowy to dowód. Zgodnie z wymogami: transkrypcja z timestampami, podpisem cyfrowym.
Search. Szukasz "co ustaliliśmy z klientem X w marcu" - znajdujesz odpowiedni fragment rozmowy w sekundy zamiast odsłuchiwać godziny nagrań.
Porównanie: Whisper (OpenAI) vs prywatne AI
| Aspekt | Whisper API | Prywatne AI |
|---|---|---|
| Koszt per minuta | 0,40 - 0,80 zł | Stały koszt serwera |
| Dane w USA | Tak | Nie |
| RODO compliance | Problematyczne | Pełne |
| Dokładność polski | 94-96% | 90-95% (Bielik STT) |
| Szybkość | Zwykle szybsze | Zależy od serwera |
| Koszt przy 100h/mies | 2 400 - 4 800 zł | 1 500 - 2 500 zł |
Dla małej skali i niewrażliwych nagrań: Whisper. Dla dużej skali i wrażliwych: prywatne AI.
Jak my podchodzimy do transkrypcji
Zaczynamy od pytania: co robisz z nagraniami? Jeśli tylko archiwizacja: prosta transkrypcja. Jeśli wyciąganie wniosków, wypełnianie dokumentów, kompleks: szersze wdrożenie z AI postprocessingiem.
Pokazujemy demo na Twoim przykładowym nagraniu, zanim cokolwiek zapłacisz.
FAQ
Czy AI radzi sobie z polskim akcentem regionalnym?
Tak, ale dokładność spada przy silnym akcencie albo szumie tła. Nagrania w dobrej jakości dają 95%+ dokładności.
Co z wieloma osobami w nagraniu?
Diarization (rozpoznawanie mówców) jest dostępna. AI oznaczy kto co powiedział. Przy 2-3 osobach działa dobrze, przy 5+ osób spada dokładność.
Czy mogę zabrać stary zapis MP3 i przepuścić przez AI?
Tak. Obsługujemy pliki MP3, WAV, M4A, OPUS. Nagrywaj w 16kHz albo wyższej dla najlepszej jakości.
Czy transkrypcja zastępuje notariusza w kancelarii?
Nie. Dla dokumentów urzędowych potrzebujesz notariusza. Transkrypcja AI jest do wewnętrznej dokumentacji pracy, archiwizacji, CRM.
Zobacz też
- Transkrypcje dla kancelarii prawnej
- Transkrypcje dla kliniki medycznej
- Transkrypcje dla biura rachunkowego
- Transkrypcje AI - hub usługi
Chcesz wycenę pod Twoje nagrania? Umów bezpłatną konsultację.


