Faceți cunoștință cu Sora, noul model text-to-video al OpenAI care creează videoclipuri HD uimitoare pe baza solicitărilor text

Nu este vorba despre „putem face asta”, ci „ar trebui să o facem”.

Pictograma timp de citire 2 min. citit


Cititorii ajută la sprijinirea MSpoweruser. Este posibil să primim un comision dacă cumpărați prin link-urile noastre. Pictograma Tooltip

Citiți pagina noastră de dezvăluire pentru a afla cum puteți ajuta MSPoweruser să susțină echipa editorială Află mai multe

Note cheie

  • OpenAI tocmai a anunțat un nou model AI text-to-video, Sora, și arată impresionant, dar înfricoșător în același timp.
  • Oamenii sunt acum îngrijorați dacă acest model le va prelua locurile de muncă.
  • Modelul va transporta metadate C2PA odată implementat într-un produs OpenAI în viitor.

OpenAI tocmai a anunțat un nou model AI text-to-video, Sora, și arată impresionant. Premisa pare destul de simplă, dar remarcabilă: puteți introduce orice mesaj de cuvânt, oricât de detaliat doriți, iar apoi modelul AI va reveni cu un videoclip foarte detaliat de 60 de secunde. 

Aruncă o privire la câteva dintre rezultatele pe care Sora le-ar putea face:

Este sincer înfricoșător și impresionant în același timp. Reacția publicului la aceasta este un amestec de uimire și alarmă, mai ales luând în considerare Trecutul legal al OpenAI dispute cu companii jurnalistice pentru că ar fi folosit articolele lor pentru a instrui modelul fără acordul lor.

Și trebuie să vorbim și despre potențialele locuri de muncă care ar putea fi înlocuite. Chiar și șeful OpenAI Sam Altman însuși, care a fost odată înlăturat din funcție, a spus că ritmul cercetării noastre AI au fost înaintând mult prea repede iar cantitatea de adaptare pe care trebuie să o facă omenirea este alarmantă.

Acest model se bazează pe cercetările anterioare DALL-E și GPT, folosind metoda unică de recapitulare a DALL-E 3 pentru a genera subtitrări extrem de descriptive pentru datele de antrenament vizual. In orice caz, încă se confruntă cu provocări în simularea realistă a scenelor complexe, înțelegerea relațiilor cauză-efect și neconfundarea detaliilor spațiale ale unui prompt.

Atunci când este implementat într-un produs OpenAI în viitor, fie că este vorba de ChatGPT, o nouă ofertă sau Copilot, modelul va conține metadate C2PA, similar cu ceea ce a făcut Microsoft. Creator de imagini de la Designer. Verificările de text și imagini protejează produsele OpenAI împotriva conținutului dăunător, cum ar fi violența, discursul instigator la ură și încălcarea IP.

„Oferim, de asemenea, acces unui număr de artiști vizuali, designeri și realizatori de film pentru a obține feedback cu privire la modul de avansare a modelului pentru a fi cel mai util pentru profesioniștii creativi”, spune OpenAI.