Na Spotify posłuchasz audiobooków czytanych przez AI. Platforma łączy siły ze startupem ElevenLabs

W czwartek gigant streamingowy ogłosił, że rozpocznie akceptowanie audiobooków nagranych za pomocą oprogramowania do syntezy głosu firmy ElevenLabs. Spotify dostrzega w tym potencjał na rozwój rynku audiobooków i jego szerszą popularyzację.
AI wkracza do branży audio
Audiobooki nagrywane przez sztuczną inteligencję już wcześniej były akceptowane przez Spotify, jednak z pewnymi ograniczeniami. Dotychczas platforma Findaway Voices, należąca do Spotify, akceptowała tylko nagrania cyfrowe pochodzące od wybranych partnerów, takich jak Google Play Books. Każdy audiobook generowany cyfrowo musiał przejść szczegółową weryfikację przed publikacją. Teraz ElevenLabs, jako jedna z najbardziej rozpoznawalnych firm zajmujących się generowaniem głosu AI, ma szansę znacznie zwiększyć liczbę audiobooków syntetycznie nagrywanych dostępnych na platformie.
Nowe możliwości dla autorów
Dzięki współpracy z ElevenLabs autorzy będą mogli skorzystać z narracji AI dostępnej w 29 różnych językach. Oprogramowanie oferuje szeroki wybór głosów syntetycznych, umożliwiając dopasowanie brzmienia do charakteru książki. Darmowa wersja ElevenLabs pozwala na wygenerowanie jedynie 10 minut narracji miesięcznie. Istnieją jednak różne poziomy subskrypcji premium, a najdroższy plan Pro, kosztujący 99 dolarów miesięcznie, umożliwia stworzenie nawet 500 minut nagrania – czyli średniej długości audiobooka.
Czy AI zastąpi ludzkich lektorów?
Spotify podkreśla, że nadal wierzy w siłę ludzkiej narracji, jednak dostrzega korzyści wynikające z wykorzystania głosów syntetycznych. Może to znacznie obniżyć koszty produkcji dla mniejszych autorów oraz ułatwić adaptację starszych, mniej popularnych tytułów, które bez tego mogłyby zostać zapomniane. Aby zapewnić przejrzystość dla słuchaczy, wszystkie audiobooki z narracją AI będą wyraźnie oznaczone informacją „Ten audiobook jest narracją cyfrową” w metadanych i opisach książek.
Startup ElevenLabs partnerem polskiej prezydencji w Radzie UE – zapewni dubbing konferencji prasowych
W ramach bezkosztowego porozumienia, treść każdej konferencji prasowej po nieformalnych spotkaniach ministrów UE w Warszawie będzie dubbingowana ElevenLabs na języki polski, angielski i francuski przy użyciu technologii audio AI. Co ważne: dubbing jest odzwierciedleniem 1:1 oryginalnej wypowiedzi, a jakość tłumaczenia jest dodatkowo sprawdzana i weryfikowana.