Vygenerování 1 minuty videa Sora od OpenAI může trvat déle než hodinu

Domů » Novinky

Ikona času čtení 2 min. číst

Ikona kalendáře Publikované dne Února 21, 2024

by Devesh Beri

publikováno dne Února 21, 2024

Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi.

Klíčové poznámky

Sora od OpenAI generuje videa z textových výzev, ale doba vykreslování je dlouhá.
Diskuse naznačují, že vytvoření minuty videa může trvat déle než hodinu.
Uživatelé vyjádřili obavy ohledně škálovatelnosti a praktičnosti iterativních pracovních postupů.

Nedávno představený model umělé inteligence OpenAI, Sora, generuje realisticky vypadající videa z textových výzev. Diskuse však naznačují, že generování jediné minuty videa pomocí Sora může trvat přes hodinu.

I když přesný časový rámec zůstává nejasný, tento příspěvek na Redditu označuje značné doby vykreslování ve srovnání s tradičními metodami vytváření videa. Je důležité poznamenat, že tyto diskuse jsou založeny na omezených informacích, přičemž výzkumníci primárně předvádějí předem vybrané příklady a neumožňují veřejný přístup k vlastním výzvám. Nejdelší předvedené video mělo pouhých 17 sekund.

Na tyto doby vykreslování se objevilo několik pohledů. Někteří uživatelé komentovali nepraktičnost dlouhých časů vykreslování, zejména při opakování několika výzev:

Pokud budete potřebovat vyzkoušet více výzev, bude to velký problém.

Jiní spekulovali o možných důvodech dlouhých vykreslovacích časů, přičemž jeden uživatel se odvolával na komentáře generálního ředitele OpenAI, Sama Altmana, týkající se významných potřeb financování:

Chápu proč on (Sam Altman) teď chce 7 bilionů.

Bylo také provedeno srovnání s dalším nedávno oznámeným modelem umělé inteligence, Gemini od Googlu 1.5, zdůrazňující konkurenční prostředí:

Komentář
byu/hasanahmad z diskuse
inOpenAI

Nakonec se někteří uživatelé pokusili uvést časy vykreslování do kontextu jejich srovnáním s tradiční animací:

To je docela rozumné. 90 hodin na 90minutový film. Když spočítáte úspory za veškerou typickou práci s animací, není to vůbec šílené. Ale za předpokladu nulových záběrů, 100% přesnosti, nulových halucinací a 100% přenosu postav po většinu filmu,

Jednou z nejpozoruhodnějších věcí je, že čas není překvapivý, ale absence 1 minuty mi říká, že po 20 sekundách může začít hodně halucinovat, což je v současné době známé u LLM.

Celkově informace týkající se doby vykreslování Sory podtrhují probíhající vývojovou fázi technologie. I když je potenciál pro tvorbu videí generovaných umělou inteligencí zřejmý, řešení efektivity a škálovatelnosti zůstává zásadní pro širší přijetí.

Jak se Sora neustále vyvíjí, bude zajímavé sledovat, jak se tyto výzvy vypořádají a jak technologie utváří budoucnost tvorby videa.

Více o tématech: openAI, Sora

Devesh Beri

Technický novinář

To jsou věci, které mě motivují – vytvářet informativní a užitečný obsah, věnovat se své vášni pro motoristický sport a hudbu, účastnit se expedic, udržovat zdravý životní styl a trávit čas se svou rozkošnou kočkou Taco.

Napsat komentář