Microsoft slår Ms. Pac-Man med ett unikt multiagent AI-system

Lästid ikon 2 min. läsa


Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar. Verktygstipsikon

Läs vår informationssida för att ta reda på hur du kan hjälpa MSPoweruser upprätthålla redaktionen Läs mer

Ett artificiell intelligensbaserat system utvecklat av Microsoft har uppnått högsta möjliga poäng för Ms. Pac-Man-spelet, 999,990 XNUMX. Detta system utvecklades av ett team på Maluuba, en kanadensisk startup för djupinlärning som förvärvades av Microsoft tidigare i år. De använde en dela-och-härska-metod som kunde ha breda konsekvenser för att lära AI-agenter att utföra komplexa uppgifter. Detta är en betydande prestation eftersom AI-forskare alltid har funnit att Pac-Man bland de svåraste att knäcka. Maluuba-teamet kallar tekniken som används i detta system för Hybrid Reward Architecture. Läs om det i detalj nedan,

Denna teknik använder mer än 150 agenter, som var och en arbetade parallellt med de andra agenterna för att bemästra Ms. Pac-Man. Till exempel fick vissa agenter en belöning för att de lyckades hitta en specifik pellet, medan andra fick i uppdrag att hålla sig borta från spöken. Sedan skapade forskarna en toppagent – ​​ungefär som en senior chef på ett företag – som tog förslag från alla agenter och använde dem för att bestämma vart hon skulle flytta Pac-Man.

Toppagenten tog hänsyn till hur många agenter som förespråkade att gå i en viss riktning, men den tittade också på med vilken intensitet de ville göra det steget. Till exempel, om 100 agenter ville gå höger eftersom det var den bästa vägen till deras pellet, men tre ville gå vänster eftersom det fanns ett dödligt spöke till höger, skulle det ge mer vikt åt de som hade lagt märke till spöket och gå till vänster.

Tekniken är särskilt intressant eftersom många komplexa uppgifter som normalt skulle vara för svåra för maskininlärningssystem att ta sig an kan delas upp i flera individuella enklare uppgifter, med betydande implikationer för mängden och typen av arbete som AI snart kommer att kunna förskjuta.

Läs mer om den här historien här..

Mer om ämnena: ai, Maluubas Hybrid Reward Architecture, microsoft, Ms. Pac-Man, förstärkning lärande