Ismerje meg Sorát, az OpenAI új szöveg-videó modelljét, amely lenyűgöző HD videókat készít szöveges felszólítások alapján

Nem az a kérdés, hogy „meg tudjuk-e csinálni”, hanem „meg kell-e tennünk”.

Kezdőlap » Hírek

2 perc olvas

Publikálva Február 16, 2024

by Rafly Gilang

közzétették Február 16, 2024

Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol.

Főbb megjegyzések

Az OpenAI nemrég jelentette be új szöveg-videó mesterséges intelligencia modelljét, a Sorát, amely lenyűgözőnek tűnik, ugyanakkor ijesztő.
Az emberek most aggódnak, hogy ez a modell átveszi-e a munkájukat.
A modell C2PA metaadatokat fog hordozni, ha a jövőben egy OpenAI-termékben implementálják.

Az OpenAI nemrégiben jelentett be egy új szöveg-videó AI modellt, Sora, és lenyűgözően néz ki. A feltevés meglehetősen egyszerűnek tűnik, mégis figyelemre méltó: bármilyen szót beírhatsz, bármilyen részleteset is, majd az AI-modell egy 60 másodperces, nagyon részletes videóval tér vissza.

Vessen egy pillantást azokra az eredményekre, amelyekre Sora képes volt:

Felszólítás: „Számos óriás gyapjas mamut közeledik a havas réten, hosszú, gyapjas bundájukat enyhén fújja a szél járás közben, hóval borított fák és drámai hófödte hegyek a távolban, délutáni fényben szikrázó felhők és magasan süt a nap. a távolság… pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) Február 15, 2024

Felszólítás: "Egy filmelőzetes, amely a 30 éves űrember kalandjait mutatja be, piros gyapjú kötött motoros sisakot viselő, kék égbolttal, sósivataggal, moziszerű stílusban, 35 mm-es filmre forgatva, élénk színekkel." pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) Február 15, 2024

Felszólítás: „Egy korallzátony pompásan renderelt papíripari világa, tele színes halakkal és tengeri élőlényekkel.” pic.twitter.com/gzEE8SwP81
- OpenAI (@OpenAI) Február 15, 2024

Felszólítás: „Az animációs jelenet egy olvadó vörös gyertya mellett térdelő rövid bolyhos szörnyet ábrázol közelről. a művészet stílusa 3D és valósághű, a világításra és a textúrára összpontosítva. a festmény hangulata a csodálkozásé és a kíváncsiságé, ahogy a szörny a lángot nézi… pic.twitter.com/aLMgJPI0y6
- OpenAI (@OpenAI) Február 15, 2024

Ez őszintén ijesztő és lenyűgöző egyszerre. A közvélemény reakciója az áhítat és a riadalom keveréke, különösen, ha figyelembe vesszük Az OpenAI múltbeli jogásza viták újságírói cégekkel, amiért állítólag cikkeikkel a modellt a beleegyezésük nélkül képezték ki.

És beszélnünk kell azokról a lehetséges munkahelyekről is, amelyeket le lehetne cserélni. Még maga az OpenAI főnöke, Sam Altman is, akit egykor kiszorítottak a pozícióból, azt mondta, hogy az AI-kutatásunk üteme az volt túl gyorsan halad előre és riasztó az alkalmazkodás mértéke, amelyet az emberiségnek végre kell hajtania.

Ez a modell a korábbi DALL-E és GPT kutatásokra épül, és a DALL-E 3 egyedi feljegyzési módszerét használja, hogy rendkívül leíró feliratokat generáljon a vizuális képzési adatokhoz. Azonban, még mindig kihívásokkal néz szembe összetett jelenetek valósághű szimulációjában, az ok-okozati összefüggések megértésében, és a felszólítás térbeli részleteinek összekeverésében.

Ha a jövőben beépítik egy OpenAI-termékbe, legyen az ChatGPT, egy új ajánlat vagy másodpilóta, a modell C2PA metaadatokat fog hordozni, hasonlóan ahhoz, amit a Microsoft tett. Image Creator a Designertől. A szöveg- és képellenőrzések megvédik az OpenAI-termékeket az olyan káros tartalmaktól, mint az erőszak, a gyűlöletbeszéd és az IP-sértés.

„Számos képzőművésznek, tervezőnek és filmesnek is hozzáférést biztosítunk, hogy visszajelzést kaphassanak arról, hogyan lehet továbbfejleszteni a modellt, hogy a leghasznosabb legyen a kreatív szakemberek számára” – mondja az OpenAI.

Rafly Gilang

Tech Riporter

Rafly egy riporter, aki több éves újságírói tapasztalattal rendelkezik a technológiai, üzleti, társadalmi és kulturális területeken. Jelenleg híreket jelent a Microsofttal kapcsolatos termékekről, technológiáról és mesterséges intelligenciáról a Windows Report és az MSPowerUser oldalon. Van tipped? Küldd el [e-mail védett].