Microsoft DeBERTa supera humanos insignificantes no teste de compreensão de leitura SuperGlue

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Microsoft Project One Fuzz

Recentemente, houve um grande progresso no treinamento de redes com milhões de parâmetros. A Microsoft atualizou recentemente o modelo DeBERTa (BERT aprimorado por decodificação com atenção desembaraçada) treinando uma versão maior que consiste em 48 camadas Transformer com 1.5 bilhão de parâmetros. O aumento significativo de desempenho faz com que o único modelo DeBERTa supere o desempenho humano no processamento e compreensão da linguagem SuperGLUE pela primeira vez em termos de pontuação macro média (89.9 versus 89.8), superando a linha de base humana por uma margem decente (90.3 versus 89.8) . O benchmark SuperGLUE consiste em uma ampla gama de tarefas de compreensão de linguagem natural, incluindo resposta a perguntas, inferência de linguagem natural. O modelo também está no topo do ranking de benchmark GLUE com uma pontuação média macro de 90.8.

O DeBERTa melhora os PLMs de última geração anteriores (por exemplo, BERT, RoBERTa, UniLM) usando três novas técnicas: um mecanismo de atenção desembaraçado, um decodificador de máscara aprimorado e um método de treinamento adversário virtual para ajuste fino.

Comparado ao modelo T5 do Google, que consiste em 11 bilhões de parâmetros, o DeBERTa de 1.5 bilhão de parâmetros é muito mais eficiente em termos de energia para treinar e manter, e é mais fácil de compactar e implantar em aplicativos de várias configurações.

DeBERTa superando o desempenho humano no SuperGLUE marca um marco importante em direção à IA geral. Apesar de seus resultados promissores no SuperGLUE, o modelo não está de forma alguma atingindo a inteligência em nível humano do NLU. Os humanos são extremamente bons em alavancar o conhecimento aprendido em diferentes tarefas para resolver uma nova tarefa com pouca ou nenhuma demonstração específica de tarefa.

A Microsoft integrará a tecnologia na próxima versão do modelo de representação de linguagem natural Microsoft Turing, usado em locais como Bing, Office, Dynamics e Azure Cognitive Services, capacitando uma ampla gama de cenários envolvendo interações homem-máquina e homem-humano por meio de linguagem natural (como chatbot, recomendação, resposta a perguntas, pesquisa, assistência pessoal, automação de suporte ao cliente, geração de conteúdo e outros). Além disso, a Microsoft lançará o modelo DeBERTa de 1.5 bilhão de parâmetros e o código-fonte para o público.

Leia todos os detalhes na Microsoft SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Mais sobre os tópicos: ai, microsoft

Deixe um comentário

O seu endereço de e-mail não será publicado. Os campos obrigatórios são marcados com *