Ismerje meg Sorát, az OpenAI új szöveg-videó modelljét, amely lenyűgöző HD videókat készít szöveges felszólítások alapján

Nem az a kérdés, hogy „meg tudjuk-e csinálni”, hanem „meg kell-e tennünk”.

Olvasási idő ikonra 2 perc olvas


Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol. Eszköztipp ikon

Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább

Főbb megjegyzések

  • Az OpenAI nemrég jelentette be új szöveg-videó mesterséges intelligencia modelljét, a Sorát, amely lenyűgözőnek tűnik, ugyanakkor ijesztő.
  • Az emberek most aggódnak, hogy ez a modell átveszi-e a munkájukat.
  • A modell C2PA metaadatokat fog hordozni, ha a jövőben egy OpenAI-termékben implementálják.

Az OpenAI nemrégiben jelentett be egy új szöveg-videó AI modellt, Sora, és lenyűgözően néz ki. A feltevés meglehetősen egyszerűnek tűnik, mégis figyelemre méltó: bármilyen szót beírhatsz, bármilyen részleteset is, majd az AI-modell egy 60 másodperces, nagyon részletes videóval tér vissza. 

Vessen egy pillantást azokra az eredményekre, amelyekre Sora képes volt:

Ez őszintén ijesztő és lenyűgöző egyszerre. A közvélemény reakciója az áhítat és a riadalom keveréke, különösen, ha figyelembe vesszük Az OpenAI múltbeli jogásza viták újságírói cégekkel, amiért állítólag cikkeikkel a modellt a beleegyezésük nélkül képezték ki.

És beszélnünk kell azokról a lehetséges munkahelyekről is, amelyeket le lehetne cserélni. Még maga az OpenAI főnöke, Sam Altman is, akit egykor kiszorítottak a pozícióból, azt mondta, hogy az AI-kutatásunk üteme az volt túl gyorsan halad előre és riasztó az alkalmazkodás mértéke, amelyet az emberiségnek végre kell hajtania.

Ez a modell a korábbi DALL-E és GPT kutatásokra épül, és a DALL-E 3 egyedi feljegyzési módszerét használja, hogy rendkívül leíró feliratokat generáljon a vizuális képzési adatokhoz. Azonban, még mindig kihívásokkal néz szembe összetett jelenetek valósághű szimulációjában, az ok-okozati összefüggések megértésében, és a felszólítás térbeli részleteinek összekeverésében.

Ha a jövőben beépítik egy OpenAI-termékbe, legyen az ChatGPT, egy új ajánlat vagy másodpilóta, a modell C2PA metaadatokat fog hordozni, hasonlóan ahhoz, amit a Microsoft tett. Image Creator a Designertől. A szöveg- és képellenőrzések megvédik az OpenAI-termékeket az olyan káros tartalmaktól, mint az erőszak, a gyűlöletbeszéd és az IP-sértés.

„Számos képzőművésznek, tervezőnek és filmesnek is hozzáférést biztosítunk, hogy visszajelzést kaphassanak arról, hogyan lehet továbbfejleszteni a modellt, hogy a leghasznosabb legyen a kreatív szakemberek számára” – mondja az OpenAI.