A Microsoft legyőzi Ms. Pac-Mant az egyedülálló többügynököt tartalmazó mesterséges intelligencia rendszerrel

Olvasási idő ikonra 2 perc olvas

Naptár ikonra Publikálva Június 14, 2017

közzétették Június 14, 2017

Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol.

A Microsoft által kifejlesztett mesterséges intelligencia alapú rendszer elérte az Ms. Pac-Man játék lehetséges maximális pontszámát, 999,990 XNUMX pontot. Ezt a rendszert a Maluuba, egy kanadai mélytanulási startup csapata fejlesztette ki, amelyet a Microsoft az év elején vásárolt fel. Olyan oszd meg és uralkodj módszert alkalmaztak, amely széleskörű következményekkel járhat az AI-ügynökök bonyolult feladatok elvégzésére való megtanításában. Ez jelentős eredmény, mivel az AI-kutatók mindig is a legnehezebben feltörhetőek között találták Ms. Pac-Mant. A Maluuba csapata az ebben a rendszerben használt technikát Hybrid Reward Architecture néven nevezi. Olvasson róla részletesen alább,

Ez a technika több mint 150 ügynököt használ, amelyek mindegyike a többi ügynökkel párhuzamosan dolgozott Ms. Pac-Man elsajátításán. Egyes ügynökök például jutalmat kaptak egy bizonyos pellet sikeres megtalálásáért, míg másoknak azt a feladatot kapták, hogy távol maradjanak a szellemektől. Ezután a kutatók létrehoztak egy vezető ügynököt – mintegy felsővezetőt egy vállalatnál –, aki az összes ügynök javaslatait figyelembe vette, és ezek alapján döntötte el, hova helyezze át Ms. Pac-Mant.

A csúcsügynök figyelembe vette, hogy hány ügynök szorgalmazza egy bizonyos irányba történő elmozdulást, de azt is megvizsgálta, hogy milyen intenzitással akarták ezt a lépést megtenni. Például, ha 100 ügynök jobbra akart menni, mert ez volt a legjobb út a pelletükhöz, de hárman balra akartak menni, mert jobbra egy halálos szellem volt, az nagyobb súlyt adna azoknak, akik észrevették a szellemet és menj balra.

A technika különösen azért érdekes, mert sok olyan összetett feladat, amelyet a gépi tanulási rendszerek számára általában túl nehéz lenne felvállalni, több egyedi, egyszerűbb feladatra bontható, ami jelentős hatással lesz a munka mennyiségére és típusára, amelyet az AI hamarosan kiszoríthat.

Olvasson többet erről a történetről itt.

Bővebben a témákról: ai, Maluuba hibrid jutalom architektúrája, microsoft, Ms. Pac-Man, megerősítő tanulás

Pradeep Viswav

Szoftver- és szolgáltatásszakértő

Pradeep számítástechnikai és mérnöki végzettségű. A Microsoft diákpartnere is volt. Jelenleg egy vezető informatikai cégnél dolgozik.