Upoznajte Sora, novi OpenAI-jev model pretvaranja teksta u video koji stvara zapanjujuće HD videozapise na temelju tekstualnih upita

Nije pitanje "možemo li to učiniti", već "trebamo li to učiniti".

Ikona vremena čitanja 2 min. čitati


Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza. Ikona opisa alata

Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više

Ključne napomene

  • OpenAI je upravo najavio novi AI model za pretvaranje teksta u video, Sora, i izgleda impresivno, ali istovremeno i zastrašujuće.
  • Ljudi su sada zabrinuti hoće li ovaj model preuzeti njihove poslove.
  • Model će nositi C2PA metapodatke nakon implementacije u OpenAI proizvod u budućnosti.

OpenAI je upravo najavio novi AI model pretvaranja teksta u video, Sora, i izgleda impresivno. Pretpostavka izgleda prilično jednostavna, ali nevjerojatna: možete upisati bilo koju riječ, koliko god detaljnu želite, a zatim će se AI model vratiti s 60-sekundnim vrlo detaljnim video zapisom. 

Pogledajte neke od rezultata koje bi Sora mogla postići:

To je iskreno zastrašujuće i impresivno u isto vrijeme. Reakcija javnosti na to je mješavina strahopoštovanja i uzbune, posebno imajući u vidu OpenAI-jev prošli zakon sporove s novinarskim kućama zbog navodnog korištenja njihovih članaka za treniranje modela bez njihova pristanka.

A treba razgovarati i o potencijalnim poslovima koji bi se mogli zamijeniti. Čak i sam šef OpenAI-ja Sam Altman, koji je jednom bio smijenjen s položaja, rekao je da je tempo našeg istraživanja umjetne inteligencije bio napreduje prebrzo a količina prilagodbe koju čovječanstvo treba učiniti je alarmantna.

Ovaj se model temelji na prošlim istraživanjima DALL-E i GPT, koristeći jedinstvenu metodu recaptioninga DALL-E 3 za generiranje krajnje opisnih naslova za podatke o vizualnoj obuci. Međutim, još uvijek se suočava s izazovima u realističnom simuliranju složenih scena, razumijevanju uzročno-posljedičnih odnosa i ne brkanju prostornih detalja upita.

Kada se implementira u OpenAI proizvod u budućnosti, bilo da je riječ o ChatGPT-u, novoj ponudi ili Copilotu, model će nositi C2PA metapodatke, slično onome što Microsoft radi na Stvoritelj slika iz dizajnera. Provjere teksta i slika štite OpenAI proizvode od štetnog sadržaja poput nasilja, govora mržnje i kršenja IP-a.

“Također odobravamo pristup brojnim vizualnim umjetnicima, dizajnerima i filmašima kako bismo dobili povratne informacije o tome kako unaprijediti model kako bi bio od najveće pomoći kreativnim profesionalcima,” kaže OpenAI.

Ostavi odgovor

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena *