Az OpenAI Sora videójának 1 perces elkészítése több mint egy órát is igénybe vehet
2 perc olvas
Publikálva
Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább
Főbb megjegyzések
- Az OpenAI Sora szöveges promptokból videókat generál, de a megjelenítési idők hosszadalmasak.
- A viták azt sugallják, hogy egy percnyi videó elkészítése több mint egy órát is igénybe vehet.
- A felhasználók aggodalmukat fejezték ki az iteratív munkafolyamatok méretezhetőségével és praktikusságával kapcsolatban.
Az OpenAI nemrégiben bemutatott AI-modellje, a Sora valósághű videókat generál szöveges felszólításokból. A viták azonban azt sugallják, hogy egyetlen perces videó létrehozása a Sora segítségével akár egy órát is igénybe vehet.
Bár a pontos időkeret továbbra sem tisztázott, ezt a bejegyzést a Redditen jelentős renderelési időt jelez a hagyományos videókészítési módszerekhez képest. Fontos megjegyezni, hogy ezek a megbeszélések korlátozott információkon alapulnak, ahol a kutatók elsősorban előre kiválasztott példákat mutatnak be, és nem teszik lehetővé a nyilvános hozzáférést az egyéni promptokhoz. A leghosszabb bemutatott videó mindössze 17 másodperces volt.
Ezekkel a renderelési időkkel kapcsolatban több nézőpont is felmerült. Néhány felhasználó megjegyzést tett a hosszú megjelenítési idők kivitelezhetetlenségére, különösen akkor, ha több prompton keresztül iterálnak:
Ha több felszólítást is meg kell próbálnia, az nagy probléma lesz.
Mások a hosszú megjelenítési idők mögött meghúzódó lehetséges okokon spekuláltak, az egyik felhasználó pedig az OpenAI vezérigazgatójának, Sam Altmannak a jelentős finanszírozási igényekkel kapcsolatos megjegyzéseire hivatkozott:
Látom miért ő (Sam Altman) most 7 billiót akar.
Összehasonlításokat végeztek egy másik, nemrég bejelentett mesterséges intelligencia modellel is, A Google Gemini 1.5, kiemelve a versenyhelyzetet:
Végül néhány felhasználó megpróbálta kontextusba helyezni a renderelési időt a hagyományos animációhoz hasonlítva:
Ez elég ésszerű. 90 óra egy 90 perces filmre. Ha kiszámítja az összes tipikus animációs munka megtakarítását, ez egyáltalán nem őrültség. De feltételezve, hogy nulla lövés, 100%-os pontosság, nulla hallucináció és 100%-os karakterátadás a film nagy részében,
Az egyik legnagyobb észrevehető dolog az, hogy az idő nem meglepő, de az 1 perc hiánya azt jelzi, hogy 20 másodperc után elkezdhet sokat hallucinálnak, ami jelenleg az LLM-ekről ismert.
Összességében a Sora renderelési idejére vonatkozó információk alátámasztják a technológia folyamatban lévő fejlesztési szakaszát. Bár a mesterséges intelligencia által generált videók létrehozásának lehetőségei nyilvánvalóak, a hatékonyság és a méretezhetőség kérdése továbbra is kulcsfontosságú a szélesebb körű alkalmazáshoz.
Ahogy a Sora folyamatosan fejlődik, érdekes lesz látni, hogyan kezelik ezeket a kihívásokat, és hogyan alakítja a technológia a videókészítés jövőjét.