Vygenerování 1 minuty videa Sora od OpenAI může trvat déle než hodinu
2 min. číst
Publikované dne
Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více
Klíčové poznámky
- Sora od OpenAI generuje videa z textových výzev, ale doba vykreslování je dlouhá.
- Diskuse naznačují, že vytvoření minuty videa může trvat déle než hodinu.
- Uživatelé vyjádřili obavy ohledně škálovatelnosti a praktičnosti iterativních pracovních postupů.
Nedávno představený model umělé inteligence OpenAI, Sora, generuje realisticky vypadající videa z textových výzev. Diskuse však naznačují, že generování jediné minuty videa pomocí Sora může trvat přes hodinu.
I když přesný časový rámec zůstává nejasný, tento příspěvek na Redditu označuje značné doby vykreslování ve srovnání s tradičními metodami vytváření videa. Je důležité poznamenat, že tyto diskuse jsou založeny na omezených informacích, přičemž výzkumníci primárně předvádějí předem vybrané příklady a neumožňují veřejný přístup k vlastním výzvám. Nejdelší předvedené video mělo pouhých 17 sekund.
Na tyto doby vykreslování se objevilo několik pohledů. Někteří uživatelé komentovali nepraktičnost dlouhých časů vykreslování, zejména při opakování několika výzev:
Pokud budete potřebovat vyzkoušet více výzev, bude to velký problém.
Jiní spekulovali o možných důvodech dlouhých vykreslovacích časů, přičemž jeden uživatel se odvolával na komentáře generálního ředitele OpenAI, Sama Altmana, týkající se významných potřeb financování:
Chápu proč on (Sam Altman) teď chce 7 bilionů.
Bylo také provedeno srovnání s dalším nedávno oznámeným modelem umělé inteligence, Gemini od Googlu 1.5, zdůrazňující konkurenční prostředí:
Nakonec se někteří uživatelé pokusili uvést časy vykreslování do kontextu jejich srovnáním s tradiční animací:
To je docela rozumné. 90 hodin na 90minutový film. Když spočítáte úspory za veškerou typickou práci s animací, není to vůbec šílené. Ale za předpokladu nulových záběrů, 100% přesnosti, nulových halucinací a 100% přenosu postav po většinu filmu,
Jednou z nejpozoruhodnějších věcí je, že čas není překvapivý, ale absence 1 minuty mi říká, že po 20 sekundách může začít hodně halucinovat, což je v současné době známé u LLM.
Celkově informace týkající se doby vykreslování Sory podtrhují probíhající vývojovou fázi technologie. I když je potenciál pro tvorbu videí generovaných umělou inteligencí zřejmý, řešení efektivity a škálovatelnosti zůstává zásadní pro širší přijetí.
Jak se Sora neustále vyvíjí, bude zajímavé sledovat, jak se tyto výzvy vypořádají a jak technologie utváří budoucnost tvorby videa.