Microsoft slår Ms. Pac-Man med et unikt multi-agent AI-system

Ikon for læsetid 2 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

Et kunstig intelligens-baseret system udviklet af Microsoft har opnået den maksimalt mulige score for Ms. Pac-Man spillet, 999,990. Dette system blev udviklet af et team hos Maluuba, en canadisk opstart af dyb læring erhvervet af Microsoft tidligere på året. De brugte en del-og-hersk-metode, der kunne have brede implikationer for at lære AI-agenter at udføre komplekse opgaver. Dette er en betydelig præstation, da AI-forskere altid har fundet Ms. Pac-Man blandt de sværeste at knække. Maluuba-teamet kalder teknikken, der bruges i dette system, for Hybrid Reward Architecture. Læs mere om det nedenfor,

Denne teknik bruger mere end 150 agenter, som hver arbejdede parallelt med de andre agenter for at mestre Ms. Pac-Man. For eksempel blev nogle agenter belønnet for med succes at finde en specifik pellet, mens andre fik til opgave at holde sig ude af vejen for spøgelser. Derefter skabte forskerne en topagent – ​​lidt ligesom en senior manager i en virksomhed – som tog imod forslag fra alle agenterne og brugte dem til at beslutte, hvor hun skulle flytte Ms. Pac-Man.

Topagenten tog højde for, hvor mange agenter, der talte for at gå i en bestemt retning, men den så også på, i hvilken intensitet de ønskede at tage det skridt. For eksempel, hvis 100 agenter ønskede at gå til højre, fordi det var den bedste vej til deres pellet, men tre ønskede at gå til venstre, fordi der var et dødeligt spøgelse til højre, ville det give mere vægt til dem, der havde bemærket spøgelset og gå til venstre.

Teknikken er særligt interessant, fordi mange komplekse opgaver, som normalt ville være for svære for maskinlæringssystemer at tage sig af, kan opdeles i flere individuelle enklere opgaver, med betydelige konsekvenser for mængden og typen af ​​arbejde, AI snart vil være i stand til at fortrænge.

Læs mere om denne historie link..

Mere om emnerne: ai, Maluubas Hybrid Belønningsarkitektur, microsoft, Ms. Pac-Man, forstærkning læring