Reklama

5 rzeczy, które Transkryptomat robi lepiej niż ChatGPT. Polski startup, który warto znać

Radek Baczyński i Wojtek Gilewski
Radek Baczyński i Wojtek Gilewski – twórcy Transkryptomatu. / fot. mat. pras.
Startup Transkryptomat wyznacza nowy standard w dziedzinie transkrypcji i przetwarzania danych. To nie tylko narzędzie do zamiany mowy na tekst, ale też kompleksowa platforma, która dzięki wykorzystaniu sztucznej inteligencji potrafi przekształcić surowe nagrania w gotowe do publikacji materiały. Co istotne, za projektem stoją nasi dwaj rodacy: Wojtek Gilewski i Radek Baczyński.

Zyskaj dostęp do bazy artykułów z „My Company Polska” Zamów teraz!

Reklama

Transkrypcja i coś więcej

Transkryptomat to usługa typu speech-to-text, która z czasem przekształciła się w zaawansowane narzędzie do generowania treści. – Do niedawna oferowaliśmy wyłącznie transkrypcję, a teraz dodatkowo umożliwiamy przetwarzanie treści na różne formaty generowane przez AI – wyjaśnia Wojtek. Kluczową rolę odgrywają szablony AI. Wybierając odpowiedni, np. „wywiad” czy „konferencja”, użytkownik otrzymuje nie tylko tekst, ale również podsumowania, cytaty, a nawet notatki podcastowe, dostosowane do charakteru nagrania.

– Na przykład przy danych fokusowych prezentujemy różne, dedykowane informacje – i to naprawdę dobrze działa. Możemy też tworzyć podsumowania podcastów czy wywiadów – dodaje Radek.

Takie podejście znacząco skraca czas pracy. Zamiast transkrybować, a następnie ręcznie przenosić tekst do innych narzędzi AI, użytkownik otrzymuje gotowy materiał bezpośrednio w Transkryptomacie.

– Naszym celem było skrócenie tego procesu, czyli wykonanie jednego kroku więcej po naszej stronie. To się sprawdziło – widzimy, że średnia wartość zamówienia wzrosła, bo użytkownicy chętnie wybierają szablony. Dzięki temu mają jeden etap pracy mniej – zauważa Wojtek. To szczególnie istotne dla profesjonalistów, którzy rocznie przetwarzają tysiące minut nagrań.

Elastyczny model biznesowy

Transkryptomat rozwija nie tylko swoje możliwości technologiczne, ale również model biznesowy. Nadal dostępna jest popularna opcja Pay As You Go, czyli opłata za pojedynczy plik – co jest rzadkością na rynku. – To nasz duży atut, bo niewiele firm w świecie IT oferuje taką możliwość, a w temacie transkrypcji – żadna – mówi Wojtek.

Nowością jest plan subskrypcyjny Unlimited. – Dodaliśmy również opcję subskrypcyjną – plan Unlimited, który działa w ramach tzw. Fair Usage. Ustaliliśmy limit na poziomie 730 godzin miesięcznie, czyli dokładnie tyle, ile ma miesiąc – wyjaśnia Wojtek.

Zmiany, w tym nowy panel klienta z odtwarzaczem i edytorem, są bezpośrednią odpowiedzią na sugestie użytkowników.

Transkryptomat vs. ChatGPT – gdzie leży przewaga?

W obliczu rosnącej popularności narzędzi AI, takich jak ChatGPT czy Gemini, Transkryptomat wyróżnia się kilkoma kluczowymi cechami – szczególnie w kontekście obsługi długich i złożonych materiałów oraz bezpieczeństwa danych.

  1. Brak ograniczeń długości tekstu – podczas gdy darmowe wersje popularnych czatów AI często mają limity znaków i trudności z analizą całości, Transkryptomat radzi sobie z nagraniami trwającymi nawet 3–5 godzin. – Odbieramy informacje z całego materiału – tłumaczy Radek. To szczególnie ważne w przypadku badań fokusowych czy długich wywiadów, gdzie analiza całości jest kluczowa.

  2. Dokładność i kompleksowość w długich tekstach – ChatGPT ma tendencję do skracania tekstu, co może prowadzić do utraty istotnych informacji. Transkryptomat stosuje inne podejście. – Analizujemy tekst fragment po fragmencie, wybierając inteligentnie te części, a następnie wykonujemy pełną analizę – wyjaśnia Radek. Dzięki temu platforma nie pomija ważnych punktów treści, co jest kluczowe przy długich nagraniach.

  3. Diaryzacja i pre-processing dźwięku – Transkryptomat nie tylko transkrybuje, ale również wstępnie przetwarza nagrania, filtrując szumy i normalizując głośność. – Nie wrzucamy nagrania w formie, którą podaje nam użytkownik, tylko dodatkowo go przetwarzamy – podkreśla Wojciech. Startup oferuje także diaryzację, czyli rozpoznawanie poszczególnych mówców, co jest trudnym, ale kluczowym elementem w analizie rozmów wieloosobowych. – Nie trzeba się zastanawiać, kto co powiedział – czy to był Wojtek, Kasia, czy Radek. To najtrudniejszy etap, ale Transkryptomat dobrze sobie z nim radzi – dodaje Wojtek.

  4. Bezpieczeństwo danych i zgodność z RODO – Jedną z największych obaw związanych z ogólnodostępnymi czatami AI jest kwestia bezpieczeństwa danych. Transkryptomat zapewnia, że dane użytkowników są bezpieczne i przetwarzane na serwerach zlokalizowanych w Unii Europejskiej. – Wszystkie serwisy, z których korzystamy, działają zgodnie z RODO, więc dane nie są wykorzystywane w sposób niepożądany, np. do trenowania modeli – mówi Radek. Wojtek dodaje, że firma nie uczy modeli na danych klientów, ogranicza ryzyko. To ważna informacja dla każdego, kto obawia się o wrażliwe dane przekazywane do AI.

  5. Dedykowany panel edycyjny – Użytkownicy otrzymują panel z wbudowanym odtwarzaczem i edytorem, co pozwala na wygodne odsłuchiwanie fragmentów i edycję tekstu w jednym miejscu, bez konieczności przełączania się między aplikacjami. – To kolejny element, dzięki któremu użytkownik może pracować nad tekstem u nas, bez potrzeby kopiowania go do Worda czy czata i przełączania się między Wordem a odtwarzaczem – podsumowuje Wojtek.

Konkurencja i strategia „czerwonego oceanu”

Rynek usług transkrypcji jest duży i konkurencyjny – moi rozmówcy określają go mianem „czerwonego oceanu”. Bezpośrednia konkurencja obejmuje zarówno gigantów technologicznych, jak i firmy bazujące na modelach open source. Transkryptomat znalazł jednak swoją niszę.

Strategia Transkryptomatu opiera się na specjalizacji i obsłudze konkretnych przypadków użycia, zwłaszcza w kontekście długich nagrań. – Mamy wiele tekstów pod każdy przypadek użycia. Obsługujemy kilka segmentów klientów i mocno koncentrujemy się na firmach – wyjaśnia Radek. Dodatkowym atutem jest prostota obsługi dla osób nietechnicznych oraz gwarancja satysfakcji. – Dwa kliknięcia i plik jest wrzucony. Adresujemy też potrzeby osób nietechnicznych, których jest zaskakująco dużo. Jeśli ktoś nie jest zadowolony, zwracamy pieniądze – mówi Wojtek.

Globalne ambicje i samofinansowanie

Transkryptomat nie ogranicza się do rynku polskiego. Founderzy rozwiązania aktywnie testują rynki globalne, szukając nowych możliwości rozwoju. – Mieliśmy wersję lokalną na rynek niemiecki, a teraz testujemy rynek globalny na różne sposoby – mówi Wojtek.

Projekt od trzech lat jest w pełni samofinansujący się. – Firma jest zyskowna – podsumowuje Wojciech.

Ciągłe aktualizacje i własne know-how

Transkryptomat nieustannie rozwija swoje rozwiązania. Aktualizacje dotyczą przede wszystkim przetwarzania plików audio o różnej jakości. – Bardzo lubimy pracę z dźwiękiem: filtrujemy, podbijamy głos, normalizujemy. Dostajemy nagrania, na przykład z dyktafonu, gdzie jedna osoba mówi bardzo głośno, a druga bardzo cicho. To właśnie ten problem, który – jak sądzimy – rozwiązujemy lepiej niż popularne narzędzia – wyjaśnia Radek.

Model działania platformy jest dostosowany do konkretnych przypadków użycia i oparty na własnej infrastrukturze GPU zlokalizowanej w Europie. Dzięki temu Transkryptomat lepiej radzi sobie z różnorodnymi plikami, także tymi o niższej jakości. – Chodzi przede wszystkim o to, by wspierać szeroką gamę nagrań, bo to właśnie jakość plików jest najczęstszym wyzwaniem – dodaje Radek.

Twórcy podkreślają, że ich rozwiązania nie opierają się wyłącznie na gotowych technologiach – rozwijają własne know-how. – Kluczowe jest odpowiednie dobranie parametrów i przygotowanie danych dla modelu. To właśnie ten etap decyduje o skuteczności całego procesu – zaznacza Radek.

Pisząc ten tekst, nie musiałam długo szukać przykładów – bo sama od dawna korzystam z Transkryptomatu. Najpierw z ciekawości, potem z potrzeby, a dziś… po prostu z wygody. W pracy dziennikarskiej liczy się każda minuta, a ręczne przepisywanie godzin nagrań to coś, czego nikomu nie życzę. Dzięki Transkryptomatowi ten artykuł powstał szybciej, sprawniej i – co tu dużo mówić – zminimalizowałam frustrację do zera. AI nie zastąpi dziennikarskiego nosa, ale jeśli może wyręczyć mnie w żmudnym przewijaniu i przepisywaniu, to ja to biorę w ciemno.


Wywiad został spisany przy pomocy platformy Transkryptomat. 

Reklama

ZOBACZ RÓWNIEŻ

Reklama
Reklama