Microsoft bat Mme Pac-Man grâce à un système unique d'IA multi-agents

Icône de temps de lecture 2 minute. lis


Les lecteurs aident à prendre en charge MSpoweruser. Nous pouvons recevoir une commission si vous achetez via nos liens. Icône d'info-bulle

Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale En savoir plus

Un système basé sur l'intelligence artificielle développé par Microsoft a atteint le score maximum possible pour le jeu Ms. Pac-Man, 999,990 XNUMX. Ce système a été développé par une équipe de Maluuba, une startup canadienne d'apprentissage en profondeur acquise par Microsoft plus tôt cette année. Ils ont utilisé une méthode de division pour mieux régner qui pourrait avoir de vastes implications pour apprendre aux agents d'IA à effectuer des tâches complexes. Il s'agit d'une réalisation importante puisque les chercheurs en intelligence artificielle ont toujours trouvé Mme Pac-Man parmi les plus difficiles à craquer. L'équipe de Maluuba appelle la technique utilisée dans ce système sous le nom d'architecture de récompense hybride. Lisez à ce sujet en détail ci-dessous,

Cette technique utilise plus de 150 agents, dont chacun a travaillé en parallèle avec les autres agents pour maîtriser Mme Pac-Man. Par exemple, certains agents ont été récompensés pour avoir réussi à trouver une pastille spécifique, tandis que d'autres ont été chargés de rester à l'écart des fantômes. Ensuite, les chercheurs ont créé un agent supérieur - un peu comme un cadre supérieur dans une entreprise - qui a pris les suggestions de tous les agents et les a utilisées pour décider où déplacer Mme Pac-Man.

L'agent supérieur a pris en compte le nombre d'agents qui préconisaient d'aller dans une certaine direction, mais il a également examiné l'intensité avec laquelle ils voulaient faire ce mouvement. Par exemple, si 100 agents voulaient aller à droite parce que c'était le meilleur chemin vers leur pastille, mais que trois voulaient aller à gauche parce qu'il y avait un fantôme mortel à droite, cela donnerait plus de poids à ceux qui avaient remarqué le fantôme et va à gauche.

La technique est particulièrement intéressante car de nombreuses tâches complexes qui seraient normalement trop difficiles à assumer pour les systèmes d'apprentissage automatique peuvent être décomposées en plusieurs tâches individuelles plus simples, avec des implications importantes pour la quantité et le type de travail que l'IA pourra bientôt déplacer.

En savoir plus sur cette histoire ici.

En savoir plus sur les sujets : ai, Architecture de récompense hybride de Maluuba, microsoft, Mme Pac-Man, apprentissage par renforcement