Створення 1 хвилини відео OpenAI Sora може тривати більше години

Головна » Новини

Значок часу читання 2 хв. читати

Піктограма календаря Опубліковано 21 Лютого, 2024

by Девеш Бері

опубліковано на 21 Лютого, 2024

Читачі допомагають підтримувати MSpoweruser. Ми можемо отримати комісію, якщо ви купуєте через наші посилання.

Основні нотатки

Sora від OpenAI створює відео з текстових підказок, але час візуалізації тривалий.
Обговорення показують, що для створення хвилини відео може знадобитися більше години.
Користувачі висловили занепокоєння щодо масштабованості та практичності ітераційних робочих процесів.

Нещодавно представлена модель штучного інтелекту OpenAI, Sora, створює реалістичні відео з текстових підказок. Однак дискусії показують, що створення однієї хвилини відео за допомогою Sora може тривати більше години.

Хоча точні часові рамки залишаються незрозумілими, цю публікацію на Reddit вказує на значний час візуалізації порівняно з традиційними методами створення відео. Важливо відзначити, що ці обговорення базуються на обмеженій інформації, де дослідники переважно демонструють попередньо відібрані приклади та не дозволяють публічному доступу до спеціальних підказок. Найдовший продемонстрований ролик становив лише 17 секунд.

З’явилося кілька точок зору щодо часу візуалізації. Деякі користувачі прокоментували непрактичність тривалого часу візуалізації, особливо під час повторення кількох підказок:

Якщо вам потрібно буде спробувати кілька підказок, це буде великою проблемою.

Інші припускали потенційні причини тривалого часу візуалізації, а один користувач посилався на коментарі генерального директора OpenAI Сема Альтмана щодо значних потреб у фінансуванні:

Я розумію, чому він (Сем Альтман) зараз хоче 7 трильйонів.

Також було проведено порівняння з іншою нещодавно анонсованою моделлю ШІ, Google Gemini 1.5, підкреслюючи конкурентний ландшафт:

коментар
byu/hasanahmad з обговорення
inOpenAI

Нарешті, деякі користувачі намагалися контекстуалізувати час візуалізації, порівнюючи їх із традиційною анімацією:

Це цілком розумно. 90 годин для 90-хвилинного фільму. Коли ви підраховуєте економію за всю типову анімаційну роботу, це зовсім не божевілля. Але якщо припустити, що нуль кадрів, 100% точність, нуль галюцинацій і 100% передача персонажів протягом більшої частини фільму,

Однією з найбільш помітних речей є те, що час не дивує, але відсутність 1 хвилини говорить мені, що через 20 секунд він може почати часто галюцинують, що наразі відомо для LLM.

Загалом інформація про час візуалізації Sora підкреслює поточний етап розробки технології. Хоча потенціал для створення відео, створеного штучним інтелектом, очевидний, ефективність і масштабованість залишаються вирішальними для більш широкого впровадження.

Оскільки Sora продовжує розвиватися, буде цікаво побачити, як вирішуються ці виклики та як технології формують майбутнє створення відео.

Детальніше про теми: openAI, Сора

Девеш Бері

Технічний журналіст

Це речі, які мене мотивують: створення інформативного та корисного контенту, захоплення мотоспортом і музикою, участь в експедиціях, підтримання здорового способу життя та проведення часу з моїм чарівним котом Тако.

залишити коментар