Tutustu Soraan, OpenAI:n uuteen tekstistä videoksi -malliin, joka luo upeita HD-videoita tekstikehotteiden perusteella
Kysymys ei ole "Voimmeko tehdä sen", vaan "Pitäisikö meidän tehdä se".
2 min. lukea
Julkaistu
Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää
Keskeiset huomautukset
- OpenAI on juuri julkistanut uuden tekstistä videoksi AI-mallin, Soran, ja se näyttää vaikuttavalta mutta samalla pelottavalta.
- Ihmiset ovat nyt huolissaan, ottaako tämä malli heidän työpaikkansa.
- Malli kuljettaa C2PA-metatietoja, kun se on otettu käyttöön OpenAI-tuotteessa tulevaisuudessa.
OpenAI on juuri julkistanut uuden tekstistä videoksi tekoälymallin, sora, ja se näyttää vaikuttavalta. Sen lähtökohta näyttää melko yksinkertaiselta, mutta kuitenkin merkittävältä: voit kirjoittaa mitä tahansa sanakehotteita, kuinka yksityiskohtaisia haluat, ja sitten tekoälymalli palaa 60 sekunnin pituisella erittäin yksityiskohtaisella videolla.
Katso joitain tuloksia, joita Sora voisi tehdä:
Se on rehellisesti pelottavaa ja vaikuttavaa samaan aikaan. Yleisön reaktio siihen on sekoitus kunnioitusta ja hälytystä, varsinkin kun otetaan huomioon OpenAI:n entinen laki kiistat journalististen yritysten kanssa siitä, että he ovat käyttäneet heidän artikkeleitaan mallin kouluttamiseen ilman heidän suostumustaan.
Ja meidän on myös puhuttava mahdollisista työpaikoista, jotka voitaisiin korvata. Jopa OpenAI-pomo Sam Altman itse, joka kerran syrjäytettiin asemasta, sanoi, että tekoälytutkimuksemme vauhti on ollut etenee liian nopeasti ja ihmisten sopeutumisen määrä on hälyttävää.
Tämä malli perustuu aiempaan DALL-E- ja GPT-tutkimukseen käyttämällä DALL-E 3:n ainutlaatuista uudelleenkuvausmenetelmää luomaan erittäin kuvaavia kuvatekstejä visuaalisen harjoittelun datalle. Kuitenkin, se kohtaa edelleen haasteita monimutkaisten kohtausten realistisessa simuloinnissa, syy-seuraussuhteiden ymmärtämisessä ja kehotteen tilayksityiskohtien sekoittamisessa.
Kun se toteutetaan tulevaisuudessa OpenAI-tuotteessa, olipa kyseessä ChatGPT, uusi tarjous tai Copilot, malli sisältää C2PA-metatietoja, kuten Microsoft on tehnyt. Image Creator Designerilta. Teksti- ja kuvatarkistukset suojaavat OpenAI-tuotteita haitalliselta sisällöltä, kuten väkivallalta, vihapuheelta ja IP-loukkauksilta.
"Annamme myös pääsyn useille kuvataiteilijoille, suunnittelijoille ja elokuvantekijöille saadaksemme palautetta siitä, kuinka mallia voidaan kehittää niin, että siitä olisi eniten hyötyä luoville ammattilaisille", OpenAI sanoo.