Google VLOGGER AI da vida a las fotos con avatares parlantes realistas
2 minuto. leer
Publicado el
Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más
Notas clave
- Google AI crea avatares parlantes realistas a partir de fotografías individuales.
- VLOGGER utiliza modelos de difusión para animar fotografías de manera realista.
- Las aplicaciones potenciales incluyen avatares de realidad virtual y doblaje de vídeos.
Los investigadores de Google han desarrollado un nuevo sistema de inteligencia artificial llamado VLOGGER que puede generar videos realistas de personas hablando, gesticulando y moviéndose. a partir de una sola fotografía fija.
Esta tecnología, descrita en un artículo de investigación titulado "VLOGGER: Difusión multimodal para síntesis de avatares incorporados", aprovecha los modelos de difusión, un tipo de aprendizaje automático que destaca en la creación de imágenes a partir de descripciones de texto. Al aplicar esta tecnología al video y entrenarlo en un conjunto de datos masivo, VLOGGER puede animar fotos de una manera muy convincente.
A diferencia de trabajos anteriores, nuestro método no requiere entrenamiento para cada persona, no depende de la detección y el recorte de rostros, genera la imagen completa (no solo la cara o los labios) y considera un amplio espectro de escenarios (por ejemplo, torso visible). o identidades de sujetos diversos) que son fundamentales para sintetizar correctamente a los seres humanos que se comunican.
Los autores escribieron.
Las capacidades de VLOGGER incluyen doblar videos automáticamente en diferentes idiomas, editar videos e incluso crear videos completos a partir de una sola imagen.
Los investigadores afirman que VLOGGER supera a otros métodos en calidad de imagen y realismo. A medida que avanza esta tecnología, la línea entre videos reales y artificiales puede desdibujarse. VLOGGER ofrece un vistazo al futuro de la IA.
Sin embargo, existen preocupaciones sobre un posible uso indebido. A medida que VLOGGER perfecciona sus capacidades, también lo hace la facilidad de crear deepfakes: vídeos que reemplazan la imagen de una persona por la de otra, como lo que Sucedió con Taylor Swift.
Puedes ver los ejemplos. esta página.