Pesquisadores da Microsoft lideram a corrida para matar o mecanismo de busca

Ícone de tempo de leitura 3 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

A Microsoft está atualmente no topo da tabela de classificação na corrida para desenvolver a leitura automática – a capacidade dos computadores de ler texto arbitrário e extrair significado suficiente para responder a perguntas sobre o conteúdo.

“Estamos tentando desenvolver o que chamamos de máquina alfabetizada: uma máquina que pode ler texto, entender texto e depois aprender a se comunicar, seja por escrito ou oralmente”, disse Kaheer Suleman, cofundador da Maluuba, uma empresa de Quebec. startup de aprendizado profundo que a Microsoft adquiriu no início deste ano.

As equipes da Microsoft estão atualmente no topo da tabela de classificação SQuAD, que coloca equipes acadêmicas umas contra as outras para desenvolver tecnologia para ler informações da Wikipedia para testar quão bem os sistemas de IA podem responder a perguntas sobre passagens de texto.

Pesquisadores da Microsoft e outros especialistas acadêmicos e do setor também estão competindo pelos melhores resultados usando outro conjunto de dados, chamado MS MARCO, que usa dados reais e anônimos de consultas de pesquisa do Bing para testar a capacidade de um sistema de responder a perguntas reais de usuários reais.

“Não vamos apenas construir um monte de algoritmos para resolver problemas teóricos. Estamos usando-os para resolver problemas reais e testá-los em dados reais”, disse Rangan Majumder, gerente de programa do grupo de parceiros da divisão Bing da Microsoft. Ele está trabalhando em estreita colaboração com a equipe de pesquisa de leitura de máquina de Redmond e liderou o desenvolvimento do conjunto de dados MS MARCO.

Um sistema de leitura de máquina eficaz pode melhorar o funcionamento dos mecanismos de pesquisa. Em vez de digitar uma consulta e obter uma lista de links azuis para classificar, um sistema avançado de leitura de máquina poderia responder da mesma forma que uma pessoa muito experiente responderia a uma pergunta.

“Há muitas informações em todo o mundo, especialmente na Internet”, disse Jianfeng Gao, gerente de pesquisa de parceiros do Deep Learning Technology Center da Microsoft. “Para tornar isso útil, você precisa transformar informação em conhecimento. A tecnologia que pode preencher essa lacuna é a leitura de máquina.”

“Ele entrega as informações de maneira natural”, disse Gao.

Como muitos avanços de IA nos últimos anos, a leitura de máquina se beneficiou da tríade de melhores algoritmos de aprendizado profundo, um aumento maciço no poder de computação baseado em nuvem para executar esses algoritmos e enormes quantidades de dados para aprender e testar.

Os pesquisadores dizem que esses recursos, juntamente com os avanços nos métodos de aprendizado profundo do trabalho em áreas como reconhecimento de imagem e fala, os levaram a um ponto em que se sentem confiantes de que avanços significativos na leitura de máquina estão no horizonte.

“É um sonho de longo prazo para pesquisadores em processamento de linguagem natural e até mesmo para inteligência artificial”, disse Furu Wei, pesquisador-chefe do Grupo de Processamento de Linguagem Natural da Microsoft Research Asia.

“Este é um pequeno passo em direção ao enorme desafio da compreensão da linguagem natural”, disse Ming Zhou, diretor administrativo assistente da Microsoft Research Asia em Pequim, que lidera o Natural Language Research Group.

Mais sobre os tópicos: ai, bing, Aprendizagem profunda, leitura de maquina, microsoft, pesquisa da microsoft