Upoznajte Sora, novi OpenAI-jev model pretvaranja teksta u video koji stvara zapanjujuće HD videozapise na temelju tekstualnih upita
Nije pitanje "možemo li to učiniti", već "trebamo li to učiniti".
2 min. čitati
Objavljeno na
Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više
Ključne napomene
- OpenAI je upravo najavio novi AI model za pretvaranje teksta u video, Sora, i izgleda impresivno, ali istovremeno i zastrašujuće.
- Ljudi su sada zabrinuti hoće li ovaj model preuzeti njihove poslove.
- Model će nositi C2PA metapodatke nakon implementacije u OpenAI proizvod u budućnosti.
OpenAI je upravo najavio novi AI model pretvaranja teksta u video, Sora, i izgleda impresivno. Pretpostavka izgleda prilično jednostavna, ali nevjerojatna: možete upisati bilo koju riječ, koliko god detaljnu želite, a zatim će se AI model vratiti s 60-sekundnim vrlo detaljnim video zapisom.
Pogledajte neke od rezultata koje bi Sora mogla postići:
To je iskreno zastrašujuće i impresivno u isto vrijeme. Reakcija javnosti na to je mješavina strahopoštovanja i uzbune, posebno imajući u vidu OpenAI-jev prošli zakon sporove s novinarskim kućama zbog navodnog korištenja njihovih članaka za treniranje modela bez njihova pristanka.
A treba razgovarati i o potencijalnim poslovima koji bi se mogli zamijeniti. Čak i sam šef OpenAI-ja Sam Altman, koji je jednom bio smijenjen s položaja, rekao je da je tempo našeg istraživanja umjetne inteligencije bio napreduje prebrzo a količina prilagodbe koju čovječanstvo treba učiniti je alarmantna.
Ovaj se model temelji na prošlim istraživanjima DALL-E i GPT, koristeći jedinstvenu metodu recaptioninga DALL-E 3 za generiranje krajnje opisnih naslova za podatke o vizualnoj obuci. Međutim, još uvijek se suočava s izazovima u realističnom simuliranju složenih scena, razumijevanju uzročno-posljedičnih odnosa i ne brkanju prostornih detalja upita.
Kada se implementira u OpenAI proizvod u budućnosti, bilo da je riječ o ChatGPT-u, novoj ponudi ili Copilotu, model će nositi C2PA metapodatke, slično onome što Microsoft radi na Stvoritelj slika iz dizajnera. Provjere teksta i slika štite OpenAI proizvode od štetnog sadržaja poput nasilja, govora mržnje i kršenja IP-a.
“Također odobravamo pristup brojnim vizualnim umjetnicima, dizajnerima i filmašima kako bismo dobili povratne informacije o tome kako unaprijediti model kako bi bio od najveće pomoći kreativnim profesionalcima,” kaže OpenAI.