Faceți cunoștință cu Sora, noul model text-to-video al OpenAI care creează videoclipuri HD uimitoare pe baza solicitărilor text

Nu este vorba despre „putem face asta”, ci „ar trebui să o facem”.

Acasă » Noutăţi

2 min. citit

Publicat în data de 16 Februarie 2024

by Rafly Gilang

publicat pe 16 Februarie 2024

Cititorii ajută la sprijinirea MSpoweruser. Este posibil să primim un comision dacă cumpărați prin link-urile noastre.

Note cheie

OpenAI tocmai a anunțat un nou model AI text-to-video, Sora, și arată impresionant, dar înfricoșător în același timp.
Oamenii sunt acum îngrijorați dacă acest model le va prelua locurile de muncă.
Modelul va transporta metadate C2PA odată implementat într-un produs OpenAI în viitor.

OpenAI tocmai a anunțat un nou model AI text-to-video, Sora, și arată impresionant. Premisa pare destul de simplă, dar remarcabilă: puteți introduce orice mesaj de cuvânt, oricât de detaliat doriți, iar apoi modelul AI va reveni cu un videoclip foarte detaliat de 60 de secunde.

Aruncă o privire la câteva dintre rezultatele pe care Sora le-ar putea face:

Îndemn: „Câțiva mamuți lânoși uriași se apropie călcând printr-o pajiște înzăpezită, blana lor lungă și lânoasă suflă ușor în vânt în timp ce merg, copaci acoperiți de zăpadă și munți acoperiți de zăpadă dramatici în depărtare, lumină la mijlocul după-amiezii, cu nori firave și un soare înalt. distanta… pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) 15 Februarie 2024

Solicitare: „Un trailer de film care prezintă aventurile omului spațial de 30 de ani care poartă o cască de motocicletă tricotată din lână roșie, cer albastru, deșert de sare, stil cinematografic, filmat pe film de 35 mm, culori vii.” pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) 15 Februarie 2024

Prompt: „O lume de hârtie minunat redată a unui recif de corali, plină de pești colorați și creaturi marine.” pic.twitter.com/gzEE8SwP81
- OpenAI (@OpenAI) 15 Februarie 2024

Solicitare: „Scena animată prezintă un prim-plan al unui monstru scurt pufos îngenuncheat lângă o lumânare roșie care se topește. stilul artistic este 3d și realist, cu accent pe iluminare și textură. starea de spirit a picturii este una de mirare și curiozitate, în timp ce monstrul privește flacăra cu... pic.twitter.com/aLMgJPI0y6
- OpenAI (@OpenAI) 15 Februarie 2024

Este sincer înfricoșător și impresionant în același timp. Reacția publicului la aceasta este un amestec de uimire și alarmă, mai ales luând în considerare Trecutul legal al OpenAI dispute cu companii jurnalistice pentru că ar fi folosit articolele lor pentru a instrui modelul fără acordul lor.

Și trebuie să vorbim și despre potențialele locuri de muncă care ar putea fi înlocuite. Chiar și șeful OpenAI Sam Altman însuși, care a fost odată înlăturat din funcție, a spus că ritmul cercetării noastre AI au fost înaintând mult prea repede iar cantitatea de adaptare pe care trebuie să o facă omenirea este alarmantă.

Acest model se bazează pe cercetările anterioare DALL-E și GPT, folosind metoda unică de recapitulare a DALL-E 3 pentru a genera subtitrări extrem de descriptive pentru datele de antrenament vizual. In orice caz, încă se confruntă cu provocări în simularea realistă a scenelor complexe, înțelegerea relațiilor cauză-efect și neconfundarea detaliilor spațiale ale unui prompt.

Atunci când este implementat într-un produs OpenAI în viitor, fie că este vorba de ChatGPT, o nouă ofertă sau Copilot, modelul va conține metadate C2PA, similar cu ceea ce a făcut Microsoft. Creator de imagini de la Designer. Verificările de text și imagini protejează produsele OpenAI împotriva conținutului dăunător, cum ar fi violența, discursul instigator la ură și încălcarea IP.

„Oferim, de asemenea, acces unui număr de artiști vizuali, designeri și realizatori de film pentru a obține feedback cu privire la modul de avansare a modelului pentru a fi cel mai util pentru profesioniștii creativi”, spune OpenAI.

Rafly Gilang

Reporter tehnic

Rafly este un reporter cu ani de experiență jurnalistică, variind de la tehnologie, afaceri, sociale și cultură. Raportează în prezent știri despre produse, tehnologie și AI legate de Microsoft pe Windows Report și MSPowerUser. Ai un pont? Trimete-o la [e-mail protejat].