Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links.
Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais
Enquanto todos estamos esperando para experimentar o assistente digital Cortana no Windows Phone 8.1, a Microsoft Research está trabalhando em assistentes virtuais que podem lidar com seu trabalho na vida real, lidando com outras pessoas e muito mais. O objetivo de longo prazo da Microsoft Research de Interação situada O projeto é permitir uma nova geração de sistemas interativos que incorporam interação e computação profundamente no fluxo natural de tarefas, atividades e colaborações diárias. Cenários de exemplo incluem interação humano-robô, e-home, outdoors interativos, sistemas que monitoram, auxiliam e coordenam equipes de especialistas por meio de tarefas e procedimentos complexos, etc.
Tal assistente poderia coordenar com os assistentes de outras pessoas, ajudando a agendar compromissos sociais, compromissos de trabalho e viagens. Ele pode antecipar suas necessidades com base em atividades anteriores – como onde você jantou – e coordenar com empresas que oferecem ofertas especiais. Isso pode ajudá-lo a selecionar um filme com base nos que seus amigos gostaram.
“Assistentes inteligentes e de apoio que auxiliam e complementam as pessoas são uma aspiração fundamental na ciência da computação”, diz Horvitz, “e a pesquisa básica neste espaço inclui a coleta de dados e a observação de pessoas conversando, colaborando e ajudando umas às outras para que possamos aprender a melhor desenvolver sistemas que possam servir neste papel.”
A atual assistente virtual Monica da Microsoft possui os seguintes recursos de interação.
Interação básica: ilustra uma interação básica de um único participante com o sistema. Observe as várias camadas de análise de cena (o sistema rastreia o rosto e a pose do usuário, infere informações sobre roupas, afiliação, objetivos da tarefa etc.) e o modelo de envolvimento natural (o sistema se envolve à medida que o usuário se aproxima)
Inferências de cena e aterramento: o sistema infere os objetivos do usuário a partir da análise da cena (o usuário está vestido formalmente, portanto, provavelmente externo, portanto, provavelmente deseja registro), mas fundamenta essas informações por meio de diálogo. Observe também o aterramento do número do prédio.
Modelagem e engajamento da atenção: o sistema monitora a atenção do usuário (usando informações do detector de rosto e rastreador de pose) e envolve o usuário de acordo.
Lidar com pessoas esperando na fila: o sistema monitora vários usuários na cena e reconhece a presença de um usuário em espera com um olhar rápido (o ponto vermelho mostra o olhar do sistema) e engajando-os temporariamente no final da conversa
Reengajamento: igual acima, só que quando o sistema volta o usuário inicial não está mais prestando atenção. Sabendo que uma pessoa está esperando na fila, o sistema chama a atenção do usuário e volta a engajar dizendo “Com licença!”
Diálogo de vários participantes: o sistema infere da cena (e confirma através do diálogo) que os dois participantes estão em um grupo juntos. O sistema então realiza uma conversa com vários participantes. Observe o modelo do olhar (ponto vermelho) que é a informação de quem é o falante e também alguns elementos da estrutura do discurso.
Diálogo multi-participante com conversa paralela: semelhante à interação anterior; no final, os usuários se envolvem em uma conversa paralela. O sistema entende que os enunciados não são endereçados a ele e, depois de um tempo, interrompe os dois usuários para transmitir a informação do vaivém. Observe também a interação da tela de toque que é usada como substituto para casos em que o reconhecimento de fala falha.
Pradeep é graduado em Ciência da Computação e Engenharia. Ele também foi um parceiro estudantil da Microsoft. Atualmente, ele trabalha em uma empresa líder de TI.