Ponaddźwiękowi

Mati Staniszewski i Piotr Dąbkowski / Fot. materiały prasowe

Kuba Dobroszek i Grzegorz Sadowski 02.09.2024 09:09 | Aktualizacja: 18.09.2024 09:09

Dwóch kumpli z warszawskiego liceum w dwa lata zbudowało startup wyceniany na ponad miliard dolarów. W tej historii wszystko kręci się wokół dźwięku, z wyjątkiem jednego – ich rozwoju. W tym kontekście mówimy raczej o prędkości światła. – Robimy coś niesamowitego i na generacje – mówi Mati Staniszewski, Co-founder ElevenLabs.

Skąd nazwa ElevenLabs?

Mati Staniszewski: Szukając nazwy dla startupu, najpierw krążyliśmy wokół haseł typu SpeechLab czy VoiceLab, ale żadne z nich nie oddawało w pełni naszych ogromnych ambicji. Potrzebowaliśmy czegoś bardziej generycznego i tak dotarliśmy do jedenastki, która zawsze była naszą szczęśliwą liczbą, jest też ważna w matematyce. Ma także liczne konotacje popkulturowe i, co ważne, pasuje nam graficznie. Jedenaście to dwie proste linie obok siebie, zupełnie jak znak pauzy. Jeśli nasza wizja świata audio AI się ziści i wszystko będzie dostępne i grające w formie audio, to ten znak zacznie się pojawiać w dowolnym momencie i kontekście.

Jak narodziła się ta wizja?

Z Piotrem (Piotr Dąbkowski, Co-founder ElevenLabs – red.) znamy się od liceum – chodziliśmy do jednej klasy w XXXIII LO Dwujęzycznym im. Mikołaja Kopernika w Warszawie. Szybko się zaprzyjaźniliśmy, razem mieszkaliśmy i podróżowaliśmy, wspólnie spędzaliśmy przez lata mnóstwo czasu! W trakcie studiów – Piotr kształcił się przede wszystkim w kierunku uczenia maszynowego, ja wybrałem studia matematyczne – razem pracowaliśmy m.in. w Operze Software ASA, która udostępnia przeglądarkę internetową Opera. Co ciekawe, najfajniejsze rzeczy zaczęły się dziać, kiedy nasze drogi zawodowe się rozeszły – co jakiś czas spotykaliśmy się weekendami na takich prywatnych hackathonach, próbując tworzyć nowe projekty.

Jakie?

Generalnie skupialiśmy się na poznawaniu konkretnych technologii – chcieliśmy sprawdzić, jak coś działa, a przy tym przetestować możliwości biznesowe. Łapaliśmy się wszystkiego: od projektów rekomendacyjnych po blockchainowe. No i pewnego weekendu zainteresowaliśmy się obszarem audio – stworzyliśmy system, który na podstawie nagranego przez ciebie głosu podpowiadał ci, jak możesz poprawić sposób mówienia. To był 2021 r., potraktowaliśmy ten projekt jako kolejny z wielu.

Co sprawiło, że do niego wróciliście?

Kilka miesięcy później mój przyszły wspólnik, wraz ze swoją dziewczyną, oglądał film, oczywiście z charakterystycznym polskim lektorem – każdą rolę czytała ta sama osoba, zero intonacji czy emocji. Piotrek wrócił do mnie i zaproponował, że skoro mamy doświadczenie w obszarze audio, może powinniśmy stworzyć coś w tej dziedzinie? Zamarzyliśmy, żeby za kilka lat wszystkie filmy były dostępne z profesjonalnym dubbingiem, w każdym języku. Problem, jaki zdiagnozowaliśmy, okazał się powszechny – koszty i stworzenie dubbingu to złożony proces w zasadzie na całym świecie. Choć nasz pierwszy pitch deck dotyczył wyłącznie dubbingu, z czasem wizja się rozrosła do tego, co teraz znacie pod nazwą ElevenLabs – staramy się ułatwiać dostęp do głosów i dźwięków.

Wydaje się, że ElevenLabs to historia spektakularnego sukcesu – w dwa lata zbudowaliście jednorożca, regularnie osiągacie kolejne kamienie milowe. A czy były – zwłaszcza na początku – jakieś naprawdę trudne momenty?

Pierwszą działką, na...