Conozca Sora, el nuevo modelo de conversión de texto a video de OpenAI que crea impresionantes videos HD basados ​​en indicaciones de texto

No se trata de "podemos hacerlo", sino de "deberíamos hacerlo".

Icono de tiempo de lectura 2 minuto. leer


Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces. Icono de información sobre herramientas

Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más

Notas clave

  • OpenAI acaba de anunciar un nuevo modelo de IA de texto a video, Sora, y parece impresionante pero aterrador al mismo tiempo.
  • A la gente ahora le preocupa si este modelo se apoderará de sus puestos de trabajo.
  • El modelo llevará metadatos C2PA una vez que se implemente en un producto OpenAI en el futuro.

OpenAI acaba de anunciar un nuevo modelo de IA de texto a video, Sora, y se ve impresionante. La premisa parece bastante simple, pero notable: puede escribir cualquier mensaje de texto, por detallado que desee, y luego el modelo de IA regresará con un video altamente detallado de 60 segundos. 

Eche un vistazo a algunos de los resultados que Sora podría lograr:

Honestamente, eso es aterrador e impresionante al mismo tiempo. La reacción del público es una mezcla de asombro y alarma, especialmente considerando El pasado legal de OpenAI Disputas con empresas periodísticas por supuestamente utilizar sus artículos para entrenar al modelo sin su consentimiento.

Y también necesitamos hablar sobre empleos potenciales que podrían ser reemplazados. Incluso el propio jefe de OpenAI, Sam Altman, quien una vez fue destituido del cargo, dijo que el ritmo de nuestra investigación en IA ha sido avanzando demasiado rápido y la cantidad de adaptación que la humanidad necesita hacer es alarmante.

Este modelo se basa en investigaciones anteriores de DALL-E y GPT, utilizando el método de recaptación exclusivo de DALL-E 3 para generar subtítulos extremadamente descriptivos para los datos de entrenamiento visual. Sin embargo, todavía enfrenta desafíos en simular de manera realista escenas complejas, comprender las relaciones de causa y efecto y no confundir los detalles espaciales de una indicación.

Cuando se implemente en un producto OpenAI en el futuro, ya sea ChatGPT, una nueva oferta o Copilot, el modelo llevará metadatos C2PA, similar a lo que Microsoft ha estado haciendo en Creador de imágenes del diseñador. Las comprobaciones de texto e imágenes protegen los productos OpenAI contra contenido dañino como violencia, incitación al odio e infracción de propiedad intelectual.

"También estamos otorgando acceso a varios artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos", dice OpenAI.