Pesquisa da Microsoft está construindo um assistente virtual inteligente com seu projeto de interação situado

Ícone de tempo de leitura 3 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Assistente Virtual da Microsoft Mônica

Enquanto todos estamos esperando para experimentar o assistente digital Cortana no Windows Phone 8.1, a Microsoft Research está trabalhando em assistentes virtuais que podem lidar com seu trabalho na vida real, lidando com outras pessoas e muito mais. O objetivo de longo prazo da Microsoft Research de Interação situada O projeto é permitir uma nova geração de sistemas interativos que incorporam interação e computação profundamente no fluxo natural de tarefas, atividades e colaborações diárias. Cenários de exemplo incluem interação humano-robô, e-home, outdoors interativos, sistemas que monitoram, auxiliam e coordenam equipes de especialistas por meio de tarefas e procedimentos complexos, etc.

Tal assistente poderia coordenar com os assistentes de outras pessoas, ajudando a agendar compromissos sociais, compromissos de trabalho e viagens. Ele pode antecipar suas necessidades com base em atividades anteriores – como onde você jantou – e coordenar com empresas que oferecem ofertas especiais. Isso pode ajudá-lo a selecionar um filme com base nos que seus amigos gostaram.

“Assistentes inteligentes e de apoio que auxiliam e complementam as pessoas são uma aspiração fundamental na ciência da computação”, diz Horvitz, “e a pesquisa básica neste espaço inclui a coleta de dados e a observação de pessoas conversando, colaborando e ajudando umas às outras para que possamos aprender a melhor desenvolver sistemas que possam servir neste papel.”

A atual assistente virtual Monica da Microsoft possui os seguintes recursos de interação.

Interação básica: ilustra uma interação básica de um único participante com o sistema. Observe as várias camadas de análise de cena (o sistema rastreia o rosto e a pose do usuário, infere informações sobre roupas, afiliação, objetivos da tarefa etc.) e o modelo de envolvimento natural (o sistema se envolve à medida que o usuário se aproxima)
Inferências de cena e aterramento: o sistema infere os objetivos do usuário a partir da análise da cena (o usuário está vestido formalmente, portanto, provavelmente externo, portanto, provavelmente deseja registro), mas fundamenta essas informações por meio de diálogo. Observe também o aterramento do número do prédio.
Modelagem e engajamento da atenção: o sistema monitora a atenção do usuário (usando informações do detector de rosto e rastreador de pose) e envolve o usuário de acordo.
Lidar com pessoas esperando na fila: o sistema monitora vários usuários na cena e reconhece a presença de um usuário em espera com um olhar rápido (o ponto vermelho mostra o olhar do sistema) e engajando-os temporariamente no final da conversa
Reengajamento: igual acima, só que quando o sistema volta o usuário inicial não está mais prestando atenção. Sabendo que uma pessoa está esperando na fila, o sistema chama a atenção do usuário e volta a engajar dizendo “Com licença!”
Diálogo de vários participantes: o sistema infere da cena (e confirma através do diálogo) que os dois participantes estão em um grupo juntos. O sistema então realiza uma conversa com vários participantes. Observe o modelo do olhar (ponto vermelho) que é a informação de quem é o falante e também alguns elementos da estrutura do discurso.
Diálogo multi-participante com conversa paralela: semelhante à interação anterior; no final, os usuários se envolvem em uma conversa paralela. O sistema entende que os enunciados não são endereçados a ele e, depois de um tempo, interrompe os dois usuários para transmitir a informação do vaivém. Observe também a interação da tela de toque que é usada como substituto para casos em que o reconhecimento de fala falha.
Diálogo multi-participante com uma terceira pessoa esperando: que também ilustra como o sistema trata um participante em espera enquanto interage com um grupo de dois usuários.

Leia mais sobre este projeto em Microsoft Research.

Mais sobre os tópicos: microsoft, pesquisa, robôs, Interação situada, smart, Assistente virtual

Deixe um comentário

O seu endereço de e-mail não será publicado. Os campos obrigatórios são marcados com *