Встречайте Sora, новую модель преобразования текста в видео OpenAI, которая создает потрясающие HD-видео на основе текстовых подсказок.

Вопрос не в том, «можем ли мы это сделать», а в том, «должны ли мы это сделать».

Главная » Новости

Значок времени чтения 2 минута. читать

Значок календаря Опубликовано 16 февраля 2024

by Рафли Гиланг

Опубликован в 16 февраля 2024

Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам.

Ключевые заметки

OpenAI только что анонсировала новую модель ИИ для преобразования текста в видео, Sora, и она выглядит впечатляюще, но в то же время устрашающе.
Теперь люди обеспокоены тем, сможет ли эта модель занять их рабочие места.
Модель будет содержать метаданные C2PA, как только они будут реализованы в будущем в продукте OpenAI.

OpenAI только что анонсировала новую модель искусственного интеллекта для преобразования текста в видео. Сора, и это выглядит впечатляюще. Идея этого выглядит довольно простой, но замечательной: вы можете ввести любые текстовые подсказки, насколько бы подробными вы ни хотели, а затем модель ИИ вернется с 60-секундным высокодетализированным видео.

Взгляните на некоторые результаты, которых смог добиться Сора:

Подсказка: «Несколько гигантских шерстистых мамонтов приближаются, ступая по заснеженному лугу, их длинный шерстистый мех слегка развевается на ветру, когда они идут, заснеженные деревья и потрясающие заснеженные горы вдалеке, полуденный свет с тонкими облаками и солнце высоко в небе. Расстояние... pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) 15 февраля 2024

Подсказка: «Трейлер фильма о приключениях 30-летнего космонавта в красном шерстяном вязаном мотоциклетном шлеме, голубое небо, соляная пустыня, кинематографический стиль, снятый на 35-миллиметровую пленку, яркие цвета». pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) 15 февраля 2024

Подсказка: «Великолепно нарисованный мир кораллового рифа, сделанный из бумаги, изобилующий разноцветными рыбами и морскими существами». pic.twitter.com/gzEE8SwP81
- OpenAI (@OpenAI) 15 февраля 2024

Подсказка: «В анимационной сцене крупным планом показан невысокий пушистый монстр, стоящий на коленях рядом с тающей красной свечой. Художественный стиль трехмерный и реалистичный, с упором на освещение и текстуру. Настроение картины — удивление и любопытство, поскольку монстр смотрит на пламя с… pic.twitter.com/aLMgJPI0y6
- OpenAI (@OpenAI) 15 февраля 2024

Честно говоря, это пугает и впечатляет одновременно. Общественная реакция на это представляет собой смесь благоговения и тревоги, особенно учитывая Прошлые юридические события OpenAI споры с журналистскими компаниями за то, что они якобы использовали их статьи для обучения модели без их согласия.

И нам также нужно поговорить о потенциальных рабочих местах, которые можно заменить. Даже сам руководитель OpenAI Сэм Альтман который когда-то был отстранен от должности, сказал, что темпы наших исследований в области ИИ были продвигаемся слишком быстро и масштабы адаптации, которые необходимо предпринять человечеству, вызывают тревогу.

Эта модель основана на прошлых исследованиях DALL-E и GPT и использует уникальный метод повторения DALL-E 3 для создания чрезвычайно описательных подписей к данным визуального обучения. Однако, он все еще сталкивается с проблемами в реалистичном моделировании сложных сцен, понимании причинно-следственных связей и не путании пространственных деталей подсказки.

При реализации в будущем в продукте OpenAI, будь то ChatGPT, новое предложение или Copilot, модель будет содержать метаданные C2PA, аналогично тому, что делает Microsoft. Создатель изображений от дизайнера. Проверка текста и изображений защищает продукты OpenAI от вредоносного контента, такого как насилие, разжигание ненависти и нарушение прав интеллектуальной собственности.

«Мы также предоставляем доступ ряду художников, дизайнеров и режиссеров, чтобы получить отзывы о том, как усовершенствовать модель, чтобы она была наиболее полезной для творческих профессионалов», — говорит OpenAI.

Рафли Гиланг

Технический репортер

Рафлай — репортер с многолетним журналистским опытом в сфере технологий, бизнеса, социальной сферы и культуры. В настоящее время сообщает новости о продуктах, технологиях и искусственном интеллекте, связанных с Microsoft, в Windows Report и MSPowerUser. Есть подсказка? Отправьте это на [электронная почта защищена].