Upoznajte Sora, novi OpenAI-jev model pretvaranja teksta u video koji stvara zapanjujuće HD videozapise na temelju tekstualnih upita

Nije pitanje "možemo li to učiniti", već "trebamo li to učiniti".

Naslovna » Vijesti iz kluba

2 min. čitati

Objavljeno na Veljače 16, 2024

by Rafly Gilang

objavljeno Veljače 16, 2024

Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza.

Ključne napomene

OpenAI je upravo najavio novi AI model za pretvaranje teksta u video, Sora, i izgleda impresivno, ali istovremeno i zastrašujuće.
Ljudi su sada zabrinuti hoće li ovaj model preuzeti njihove poslove.
Model će nositi C2PA metapodatke nakon implementacije u OpenAI proizvod u budućnosti.

OpenAI je upravo najavio novi AI model pretvaranja teksta u video, Sora, i izgleda impresivno. Pretpostavka izgleda prilično jednostavna, ali nevjerojatna: možete upisati bilo koju riječ, koliko god detaljnu želite, a zatim će se AI model vratiti s 60-sekundnim vrlo detaljnim video zapisom.

Pogledajte neke od rezultata koje bi Sora mogla postići:

Uputa: "Nekoliko divovskih vunastih mamuta približava se gazeći kroz snježnu livadu, njihovo dugo vunasto krzno lagano puše na vjetru dok hodaju, snijegom prekriveno drveće i dramatične planine prekrivene snijegom u daljini, svjetlo usred poslijepodneva s tankim oblacima i sunce visoko u Udaljenost… pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) Veljače 15, 2024

Uputa: "Filmski trailer koji prikazuje avanture 30-godišnjeg svemirskog čovjeka koji nosi crvenu vunenu pletenu motociklističku kacigu, plavo nebo, slana pustinja, kinematografski stil, snimljeno na 35 mm filmu, žive boje." pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) Veljače 15, 2024

Zahtjev: "Prekrasno prikazan papirnati svijet koraljnog grebena, prepun šarenih riba i morskih stvorenja." pic.twitter.com/gzEE8SwP81
- OpenAI (@OpenAI) Veljače 15, 2024

Uputa: “Animirana scena prikazuje krupni plan niskog pahuljastog čudovišta koje kleči pokraj crvene svijeće koja se topi. umjetnički stil je 3D i realističan, s fokusom na osvjetljenje i teksturu. raspoloženje slike je čuđenje i znatiželja, dok čudovište gleda u plamen sa... pic.twitter.com/aLMgJPI0y6
- OpenAI (@OpenAI) Veljače 15, 2024

To je iskreno zastrašujuće i impresivno u isto vrijeme. Reakcija javnosti na to je mješavina strahopoštovanja i uzbune, posebno imajući u vidu OpenAI-jev prošli zakon sporove s novinarskim kućama zbog navodnog korištenja njihovih članaka za treniranje modela bez njihova pristanka.

A treba razgovarati i o potencijalnim poslovima koji bi se mogli zamijeniti. Čak i sam šef OpenAI-ja Sam Altman, koji je jednom bio smijenjen s položaja, rekao je da je tempo našeg istraživanja umjetne inteligencije bio napreduje prebrzo a količina prilagodbe koju čovječanstvo treba učiniti je alarmantna.

Ovaj se model temelji na prošlim istraživanjima DALL-E i GPT, koristeći jedinstvenu metodu recaptioninga DALL-E 3 za generiranje krajnje opisnih naslova za podatke o vizualnoj obuci. Međutim, još uvijek se suočava s izazovima u realističnom simuliranju složenih scena, razumijevanju uzročno-posljedičnih odnosa i ne brkanju prostornih detalja upita.

Kada se implementira u OpenAI proizvod u budućnosti, bilo da je riječ o ChatGPT-u, novoj ponudi ili Copilotu, model će nositi C2PA metapodatke, slično onome što Microsoft radi na Stvoritelj slika iz dizajnera. Provjere teksta i slika štite OpenAI proizvode od štetnog sadržaja poput nasilja, govora mržnje i kršenja IP-a.

“Također odobravamo pristup brojnim vizualnim umjetnicima, dizajnerima i filmašima kako bismo dobili povratne informacije o tome kako unaprijediti model kako bi bio od najveće pomoći kreativnim profesionalcima,” kaže OpenAI.

Rafly Gilang

Tehnički izvjestitelj

Rafly je reporter s godinama novinarskog iskustva, u rasponu od tehnologije, poslovanja, društvenih i kulturnih. Trenutno izvještava o novostima o Microsoftovim proizvodima, tehnologiji i umjetnoj inteligenciji na Windows izvješću i MSPowerUser. Imate savjet? Pošaljite na [e-pošta zaštićena].

Ostavi odgovor