Conozca Sora, el nuevo modelo de conversión de texto a video de OpenAI que crea impresionantes videos HD basados en indicaciones de texto

No se trata de "podemos hacerlo", sino de "deberíamos hacerlo".

2 minuto. leer

Publicado el Febrero 16, 2024

Publicado en Febrero 16, 2024

Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces.

Notas clave

OpenAI acaba de anunciar un nuevo modelo de IA de texto a video, Sora, y parece impresionante pero aterrador al mismo tiempo.
A la gente ahora le preocupa si este modelo se apoderará de sus puestos de trabajo.
El modelo llevará metadatos C2PA una vez que se implemente en un producto OpenAI en el futuro.

OpenAI acaba de anunciar un nuevo modelo de IA de texto a video, Sora, y se ve impresionante. La premisa parece bastante simple, pero notable: puede escribir cualquier mensaje de texto, por detallado que desee, y luego el modelo de IA regresará con un video altamente detallado de 60 segundos.

Eche un vistazo a algunos de los resultados que Sora podría lograr:

Mensaje: “Varios mamuts lanudos gigantes se acercan caminando a través de un prado nevado, su largo pelaje lanudo se mueve ligeramente con el viento mientras caminan, árboles cubiertos de nieve y espectaculares montañas cubiertas de nieve en la distancia, luz de media tarde con nubes tenues y un sol alto en la distancia… pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) Febrero 15, 2024

Mensaje: “Un tráiler de película que presenta las aventuras del hombre espacial de 30 años que lleva un casco de motocicleta tejido de lana roja, cielo azul, desierto salado, estilo cinematográfico, filmado en película de 35 mm, colores vivos”. pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) Febrero 15, 2024

Mensaje: "Un mundo de papel magníficamente representado de un arrecife de coral, plagado de peces de colores y criaturas marinas". pic.twitter.com/gzEE8SwP81
- OpenAI (@OpenAI) Febrero 15, 2024

Mensaje: “La escena animada presenta un primer plano de un monstruo bajo y esponjoso arrodillado junto a una vela roja que se derrite. El estilo artístico es 3D y realista, con especial atención a la iluminación y la textura. El ambiente de la pintura es de asombro y curiosidad, mientras el monstruo mira la llama con... pic.twitter.com/aLMgJPI0y6
- OpenAI (@OpenAI) Febrero 15, 2024

Honestamente, eso es aterrador e impresionante al mismo tiempo. La reacción del público es una mezcla de asombro y alarma, especialmente considerando El pasado legal de OpenAI Disputas con empresas periodísticas por supuestamente utilizar sus artículos para entrenar al modelo sin su consentimiento.

Y también necesitamos hablar sobre empleos potenciales que podrían ser reemplazados. Incluso el propio jefe de OpenAI, Sam Altman, quien una vez fue destituido del cargo, dijo que el ritmo de nuestra investigación en IA ha sido avanzando demasiado rápido y la cantidad de adaptación que la humanidad necesita hacer es alarmante.

Este modelo se basa en investigaciones anteriores de DALL-E y GPT, utilizando el método de recaptación exclusivo de DALL-E 3 para generar subtítulos extremadamente descriptivos para los datos de entrenamiento visual. Sin embargo, todavía enfrenta desafíos en simular de manera realista escenas complejas, comprender las relaciones de causa y efecto y no confundir los detalles espaciales de una indicación.

Cuando se implemente en un producto OpenAI en el futuro, ya sea ChatGPT, una nueva oferta o Copilot, el modelo llevará metadatos C2PA, similar a lo que Microsoft ha estado haciendo en Creador de imágenes del diseñador. Las comprobaciones de texto e imágenes protegen los productos OpenAI contra contenido dañino como violencia, incitación al odio e infracción de propiedad intelectual.

"También estamos otorgando acceso a varios artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos", dice OpenAI.

Rafly Gilang

Reportero técnico

Rafly es un reportero con años de experiencia periodística, que abarca desde tecnología, negocios, redes sociales y cultura. Actualmente informa noticias sobre productos, tecnología e inteligencia artificial relacionados con Microsoft en Windows Report y MSPowerUser. ¿Tienes un consejo? envíalo a [email protected].