Microsoft Research está construyendo un asistente virtual inteligente con su proyecto de interacción situado

Icono de tiempo de lectura 3 minuto. leer

Icono de calendario Publicado el Abril 9, 2014

Publicado en Abril 9, 2014

Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces.

Mientras todos esperamos probar el asistente digital de Cortana en Windows Phone 8.1, Microsoft Research está trabajando en asistentes virtuales que pueden manejar su trabajo en la vida real, tratar con otras personas y más. El objetivo a largo plazo de Microsoft Research de la Interacción situada El proyecto es permitir una nueva generación de sistemas interactivos que integren la interacción y la computación profundamente en el flujo natural de las tareas, actividades y colaboraciones cotidianas. Los escenarios de ejemplo incluyen interacción humano-robot, e-home, vallas publicitarias interactivas, sistemas que monitorean, ayudan y coordinan equipos de expertos a través de tareas y procedimientos complejos, etc.

Tal asistente podría coordinarse con los asistentes de otras personas, ayudando a programar compromisos sociales, compromisos laborales y viajes. Podría anticipar sus necesidades en función de actividades pasadas, como dónde ha disfrutado cenando, y coordinarse con empresas que ofrecen ofertas especiales. Podría ayudarlo a seleccionar una película según las que les gustaron a sus amigos.

“Los asistentes inteligentes y de apoyo que ayudan y complementan a las personas son una aspiración clave en las ciencias de la computación”, dice Horvitz, “y la investigación básica en este espacio incluye la recopilación de datos y la observación de personas que conversan, colaboran y se ayudan entre sí para que podamos aprender cómo mejorar. desarrollar sistemas que puedan servir en este rol”.

El actual asistente virtual Monica de Microsoft tiene las siguientes características de interacción.

Interacción básica: ilustra una interacción básica de un solo participante con el sistema. Observe las diversas capas de análisis de la escena (el sistema rastrea la cara y la pose del usuario, infiere información sobre la ropa, la afiliación, los objetivos de la tarea, etc.) y el modelo de participación natural (el sistema se involucra cuando el usuario se acerca)

Inferencias de escena y conexión a tierra: los sistemas infieren los objetivos del usuario a partir del análisis de la escena (el usuario está vestido formalmente, por lo tanto, lo más probable es que sea externo, por lo tanto, probablemente quiera registrarse), pero basa esta información a través del diálogo. Observe también la conexión a tierra del número de edificio.

Modelado de atención y compromiso.: los sistemas monitorean la atención del usuario (utilizando la información del detector de rostros y el rastreador de poses) e involucran al usuario en consecuencia.

Manejo de personas esperando en la fila: el sistema monitorea a varios usuarios en la escena y reconoce la presencia de un usuario que espera con una mirada rápida (el punto rojo muestra la mirada del sistema) y al involucrarlos temporalmente hacia el final de la conversación

Re-compromiso: igual que arriba, solo que cuando el sistema retrocede, el usuario inicial ya no está prestando atención. Al saber que una persona está esperando en la fila, el sistema llama la atención del usuario y vuelve a interactuar diciendo "¡Disculpe!"

Diálogo de múltiples participantes: el sistema deduce de la escena (y confirma a través del diálogo) que los dos participantes están juntos en un grupo. Luego, el sistema lleva a cabo una conversación de múltiples participantes. Observe el modelo de mirada (punto rojo) que es información sobre quién es el participante hablante y también ciertos elementos en la estructura del discurso.

Diálogo de múltiples participantes con conversación paralela: similar a la interacción anterior; al final, los usuarios participan en una conversación paralela. El sistema entiende que los enunciados no están dirigidos a él y, después de un tiempo, interrumpe a los dos usuarios para transmitir la información del transbordador. Observe también la interacción de la pantalla táctil que se utiliza como respaldo para los casos en que falla el reconocimiento de voz.

Diálogo de múltiples participantes con una tercera persona esperando: que también ilustra cómo el sistema maneja a un participante en espera mientras interactúa con un grupo de dos usuarios.

Lea más sobre este proyecto de Microsoft Research.

Más sobre los temas: microsoft, la investigación, los robots, Interacción situada, inteligente, Asistente virtual

Pradeep Viswav

Experto en Software y Servicios

Pradeep es un graduado en ingeniería y ciencias de la computación. También fue socio estudiantil de Microsoft. Actualmente trabaja en una empresa líder en TI.

Deje un comentario