OpenAI pozwoli na tworzenie wideo na podstawie opisu

Sylwia Koźmińska 16.02.2024 09:02

OpenAI, wprowadza nowy model AI o nazwie Sora, który, jak twierdzi, może tworzyć "realistyczne" i "kreatywne" wideo trwające 60 sekund na podstawie krótkich wskazówek tekstowych.

Zyskaj dostęp do bazy artykułów z „My Company Polska” Zamów teraz!

Firma twierdzi, że Sora jest zdolna do generowania wideo do 60 sekund długości na podstawie instrukcji tekstowych, z możliwością tworzenia scen z wieloma postaciami, konkretnymi rodzajami ruchu i szczegółowymi detalami tła.

"Model rozumie nie tylko to, czego użytkownik zażądał w opisie, ale także jak te rzeczy istnieją i zachowują si ę w fizycznym świecie" — czytamy na blogu OpenAI.

OpenAI powiedziało, że zamierza szkolić modele AI, aby mogły "pomagać ludziom rozwiązywać problemy wymagające interakcji ze światem rzeczywistym".

Sora nie jest jeszcze dostępna dla wszystkich

Chociaż "modele multimodalne" nie są nowością i modele tekst-na-wideo już istnieją, tym, co wyróżnia Sora jest długość i dokładność, które OpenAI przypisuje narzędziu.

Takie modele AI mogą mieć duży wpływ na rynki cyfrowej rozrywki z nowymi spersonalizowanymi treściami, które są streamowane na kanałach online.

Jednym oczywistym przypadkiem użycia jest telewizja — tworzenie krótkich scen wspierających narrację. Model jest jednak nadal ograniczony, ale pokazuje kierunek, w jakim zmierza rynek.

W tym samym czasie OpenAI powiedziało, że Sora jest nadal "pracą w toku" z wyraźnymi "słabościami", szczególnie jeśli chodzi o przestrzenne wskazówki. Zdarza jej się np. pomieszać lewą stronę z prawą, a także przyczynę ze skutkiem. Podano przykład tworzenia wideo kogoś, kto gryzie ciastko, ale nie ma śladu ugryzienia zaraz po tym.

Na razie komunikacja OpenAI pozostaje skoncentrowana na bezpieczeństwie. Firma powiedziała, że planuje pracować z zespołem ekspertów, aby testować najnowszy model i dokładnie przyjrzeć się różnym obszarom, w tym dezinformacji, treściom nienawistnym i stronniczości. Spółka powiedziała również, że tworzy narzędzia, które pomogą wykrywać wprowadzające w błąd informacje.

Sora zostanie najpierw udostępniona profesorom zajmującym się cyberbezpieczeństwem, zwanych "czerwonymi testerami", którzy mogą ocenić produkt pod kątem szkód lub ryzyka. Udziela również dostępu wielu artystom wizualnym, projektantom i filmowcom, aby zebrać opinie na temat tego, jak profesjonaliści kreatywni mogliby go używać.

Tematy: