Tutustu Soraan, OpenAI:n uuteen tekstistä videoksi -malliin, joka luo upeita HD-videoita tekstikehotteiden perusteella

Kysymys ei ole "Voimmeko tehdä sen", vaan "Pitäisikö meidän tehdä se".

Lukuajan kuvake 2 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Keskeiset huomautukset

  • OpenAI on juuri julkistanut uuden tekstistä videoksi AI-mallin, Soran, ja se näyttää vaikuttavalta mutta samalla pelottavalta.
  • Ihmiset ovat nyt huolissaan, ottaako tämä malli heidän työpaikkansa.
  • Malli kuljettaa C2PA-metatietoja, kun se on otettu käyttöön OpenAI-tuotteessa tulevaisuudessa.

OpenAI on juuri julkistanut uuden tekstistä videoksi tekoälymallin, sora, ja se näyttää vaikuttavalta. Sen lähtökohta näyttää melko yksinkertaiselta, mutta kuitenkin merkittävältä: voit kirjoittaa mitä tahansa sanakehotteita, kuinka yksityiskohtaisia ​​haluat, ja sitten tekoälymalli palaa 60 sekunnin pituisella erittäin yksityiskohtaisella videolla. 

Katso joitain tuloksia, joita Sora voisi tehdä:

Se on rehellisesti pelottavaa ja vaikuttavaa samaan aikaan. Yleisön reaktio siihen on sekoitus kunnioitusta ja hälytystä, varsinkin kun otetaan huomioon OpenAI:n entinen laki kiistat journalististen yritysten kanssa siitä, että he ovat käyttäneet heidän artikkeleitaan mallin kouluttamiseen ilman heidän suostumustaan.

Ja meidän on myös puhuttava mahdollisista työpaikoista, jotka voitaisiin korvata. Jopa OpenAI-pomo Sam Altman itse, joka kerran syrjäytettiin asemasta, sanoi, että tekoälytutkimuksemme vauhti on ollut etenee liian nopeasti ja ihmisten sopeutumisen määrä on hälyttävää.

Tämä malli perustuu aiempaan DALL-E- ja GPT-tutkimukseen käyttämällä DALL-E 3:n ainutlaatuista uudelleenkuvausmenetelmää luomaan erittäin kuvaavia kuvatekstejä visuaalisen harjoittelun datalle. Kuitenkin, se kohtaa edelleen haasteita monimutkaisten kohtausten realistisessa simuloinnissa, syy-seuraussuhteiden ymmärtämisessä ja kehotteen tilayksityiskohtien sekoittamisessa.

Kun se toteutetaan tulevaisuudessa OpenAI-tuotteessa, olipa kyseessä ChatGPT, uusi tarjous tai Copilot, malli sisältää C2PA-metatietoja, kuten Microsoft on tehnyt. Image Creator Designerilta. Teksti- ja kuvatarkistukset suojaavat OpenAI-tuotteita haitalliselta sisällöltä, kuten väkivallalta, vihapuheelta ja IP-loukkauksilta.

"Annamme myös pääsyn useille kuvataiteilijoille, suunnittelijoille ja elokuvantekijöille saadaksemme palautetta siitä, kuinka mallia voidaan kehittää niin, että siitä olisi eniten hyötyä luoville ammattilaisille", OpenAI sanoo.