Microsoft vence Ms. Pac-Man usando sistema de IA multiagente exclusivo

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Um sistema baseado em inteligência artificial desenvolvido pela Microsoft alcançou a pontuação máxima possível para o jogo Ms. Pac-Man, 999,990. Este sistema foi desenvolvido por uma equipe da Maluuba, uma startup canadense de deep learning adquirida pela Microsoft no início deste ano. Eles usaram um método de dividir e conquistar que poderia ter amplas implicações para ensinar os agentes de IA a realizar tarefas complexas. Esta é uma conquista significativa, já que os pesquisadores de IA sempre encontraram a Sra. Pac-Man entre as mais difíceis de decifrar. A equipe de Maluuba chama a técnica usada neste sistema como Arquitetura de Recompensa Híbrida. Leia sobre isso em detalhes abaixo,

Esta técnica usa mais de 150 agentes, cada um dos quais trabalhou em paralelo com os outros agentes para dominar a Sra. Pac-Man. Por exemplo, alguns agentes foram recompensados ​​por encontrar com sucesso um pellet específico, enquanto outros foram encarregados de ficar fora do caminho dos fantasmas. Em seguida, os pesquisadores criaram um agente de alto nível – como um gerente sênior de uma empresa – que recebeu sugestões de todos os agentes e as usou para decidir para onde mover a Sra. Pac-Man.

O agente principal levou em conta quantos agentes defendiam ir em uma determinada direção, mas também olhou para a intensidade com que eles queriam fazer esse movimento. Por exemplo, se 100 agentes quisessem ir para a direita porque esse era o melhor caminho para o seu pellet, mas três quisessem ir para a esquerda porque havia um fantasma mortal à direita, daria mais peso aos que notaram o fantasma e vá para esquerda.

A técnica é particularmente interessante porque muitas tarefas complexas que normalmente seriam muito difíceis para os sistemas de aprendizado de máquina podem ser divididas em várias tarefas individuais mais simples, com implicações significativas para a quantidade e o tipo de trabalho que a IA poderá substituir em breve.

Leia mais sobre esta história SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Mais sobre os tópicos: ai, Arquitetura Híbrida de Recompensa de Maluuba, microsoft, Ms. Pac-Man, aprendizagem de reforço