Встречайте Sora, новую модель преобразования текста в видео OpenAI, которая создает потрясающие HD-видео на основе текстовых подсказок.
Вопрос не в том, «можем ли мы это сделать», а в том, «должны ли мы это сделать».
2 минута. читать
Опубликовано
Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее
Ключевые заметки
- OpenAI только что анонсировала новую модель ИИ для преобразования текста в видео, Sora, и она выглядит впечатляюще, но в то же время устрашающе.
- Теперь люди обеспокоены тем, сможет ли эта модель занять их рабочие места.
- Модель будет содержать метаданные C2PA, как только они будут реализованы в будущем в продукте OpenAI.
OpenAI только что анонсировала новую модель искусственного интеллекта для преобразования текста в видео. Сора, и это выглядит впечатляюще. Идея этого выглядит довольно простой, но замечательной: вы можете ввести любые текстовые подсказки, насколько бы подробными вы ни хотели, а затем модель ИИ вернется с 60-секундным высокодетализированным видео.
Взгляните на некоторые результаты, которых смог добиться Сора:
Честно говоря, это пугает и впечатляет одновременно. Общественная реакция на это представляет собой смесь благоговения и тревоги, особенно учитывая Прошлые юридические события OpenAI споры с журналистскими компаниями за то, что они якобы использовали их статьи для обучения модели без их согласия.
И нам также нужно поговорить о потенциальных рабочих местах, которые можно заменить. Даже сам руководитель OpenAI Сэм Альтман который когда-то был отстранен от должности, сказал, что темпы наших исследований в области ИИ были продвигаемся слишком быстро и масштабы адаптации, которые необходимо предпринять человечеству, вызывают тревогу.
Эта модель основана на прошлых исследованиях DALL-E и GPT и использует уникальный метод повторения DALL-E 3 для создания чрезвычайно описательных подписей к данным визуального обучения. Однако, он все еще сталкивается с проблемами в реалистичном моделировании сложных сцен, понимании причинно-следственных связей и не путании пространственных деталей подсказки.
При реализации в будущем в продукте OpenAI, будь то ChatGPT, новое предложение или Copilot, модель будет содержать метаданные C2PA, аналогично тому, что делает Microsoft. Создатель изображений от дизайнера. Проверка текста и изображений защищает продукты OpenAI от вредоносного контента, такого как насилие, разжигание ненависти и нарушение прав интеллектуальной собственности.
«Мы также предоставляем доступ ряду художников, дизайнеров и режиссеров, чтобы получить отзывы о том, как усовершенствовать модель, чтобы она была наиболее полезной для творческих профессионалов», — говорит OpenAI.