Встречайте Sora, новую модель преобразования текста в видео OpenAI, которая создает потрясающие HD-видео на основе текстовых подсказок.

Вопрос не в том, «можем ли мы это сделать», а в том, «должны ли мы это сделать».

Значок времени чтения 2 минута. читать


Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам. Значок подсказки

Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее

Ключевые заметки

  • OpenAI только что анонсировала новую модель ИИ для преобразования текста в видео, Sora, и она выглядит впечатляюще, но в то же время устрашающе.
  • Теперь люди обеспокоены тем, сможет ли эта модель занять их рабочие места.
  • Модель будет содержать метаданные C2PA, как только они будут реализованы в будущем в продукте OpenAI.

OpenAI только что анонсировала новую модель искусственного интеллекта для преобразования текста в видео. Сора, и это выглядит впечатляюще. Идея этого выглядит довольно простой, но замечательной: вы можете ввести любые текстовые подсказки, насколько бы подробными вы ни хотели, а затем модель ИИ вернется с 60-секундным высокодетализированным видео. 

Взгляните на некоторые результаты, которых смог добиться Сора:

Честно говоря, это пугает и впечатляет одновременно. Общественная реакция на это представляет собой смесь благоговения и тревоги, особенно учитывая Прошлые юридические события OpenAI споры с журналистскими компаниями за то, что они якобы использовали их статьи для обучения модели без их согласия.

И нам также нужно поговорить о потенциальных рабочих местах, которые можно заменить. Даже сам руководитель OpenAI Сэм Альтман который когда-то был отстранен от должности, сказал, что темпы наших исследований в области ИИ были продвигаемся слишком быстро и масштабы адаптации, которые необходимо предпринять человечеству, вызывают тревогу.

Эта модель основана на прошлых исследованиях DALL-E и GPT и использует уникальный метод повторения DALL-E 3 для создания чрезвычайно описательных подписей к данным визуального обучения. Однако, он все еще сталкивается с проблемами в реалистичном моделировании сложных сцен, понимании причинно-следственных связей и не путании пространственных деталей подсказки.

При реализации в будущем в продукте OpenAI, будь то ChatGPT, новое предложение или Copilot, модель будет содержать метаданные C2PA, аналогично тому, что делает Microsoft. Создатель изображений от дизайнера. Проверка текста и изображений защищает продукты OpenAI от вредоносного контента, такого как насилие, разжигание ненависти и нарушение прав интеллектуальной собственности.

«Мы также предоставляем доступ ряду художников, дизайнеров и режиссеров, чтобы получить отзывы о том, как усовершенствовать модель, чтобы она была наиболее полезной для творческих профессионалов», — говорит OpenAI.