Microsoft Research trabaja con una IA que puede contar la historia de las instantáneas de sus vacaciones
2 minuto. leer
Publicado el
Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Más información
La IA que puede describir imágenes ya está funcionando en Internet, agregando títulos a las imágenes en Facebook, por ejemplo. Ahora Microsoft Research está llevando la tecnología al siguiente nivel, pidiéndole a su IA que cuente la historia de una serie de imágenes.
Por ejemplo, mientras que un programa de subtítulos de imágenes podría tomar cinco imágenes y decir: “Esta es una foto de una familia; esta es una foto de un pastel; esta es una foto de un perro; esta es una imagen de una playa”, el programa de narración podría tomar esas mismas imágenes y decir: “La familia se reunió para una comida al aire libre; tenían mucha comida deliciosa; el perro estaba feliz de estar allí; se lo pasaron genial en la playa; incluso se bañaron en el agua”.
En el futuro, la narración computarizada podría ayudar a las personas a generar historias automáticamente para presentaciones de diapositivas de imágenes que suben a las redes sociales, dijo Mitchell. “Ayudaría a las personas a compartir sus experiencias mientras reduce el trabajo esencial que algunas personas encuentran bastante tedioso”, dijo. La narración computarizada "también puede ayudar a las personas con discapacidad visual a abrir imágenes para personas que no pueden verlas".
"El objetivo es ayudar a dar a las IA una inteligencia más humana, para ayudarla a comprender las cosas en un nivel más abstracto: lo que significa ser divertido, espeluznante, raro o interesante", dijo la autora principal del estudio, Margaret Mitchell, científica informática de la Investigación de Microsoft. “La gente ha transmitido historias durante eones, usándolas para transmitir nuestra moral, estrategias y sabiduría. Con nuestro enfoque en la narración de historias, esperamos ayudar a las IA a comprender los conceptos humanos de una manera que sea muy segura y beneficiosa para la humanidad, en lugar de enseñarle cómo vencer a la humanidad”.
Si la IA alguna vez aprende a contar historias basadas en secuencias de imágenes, "eso es un trampolín para hacer lo mismo con el video", dijo Mitchell. “Eso podría ayudar a proporcionar aplicaciones interesantes. Por ejemplo, para las cámaras de seguridad, es posible que solo desee un resumen de algo digno de mención, o podría twittear eventos en vivo automáticamente”, dijo.
Los investigadores presentarán sus hallazgos en San Diego en la reunión anual del Capítulo Norteamericano de la Asociación de Lingüística Computacional a finales de este mes.
Foro de usuarios
mensajes de 4