Microsoft voittaa Ms Pac-Manin käyttämällä ainutlaatuista moniagentti-AI-järjestelmää

Lukuajan kuvake 2 min. lukea

Kalenterikuvake Julkaistu Kesäkuu 14, 2017

Julkaistu Kesäkuu 14, 2017

Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta.

Microsoftin kehittämä tekoälyyn perustuva järjestelmä on saavuttanut Ms. Pac-Man -pelin maksimipistemäärän, 999,990 XNUMX. Tämän järjestelmän on kehittänyt Microsoftin aiemmin tänä vuonna hankkiman kanadalaisen syväoppimisen aloitusyrityksen Maluuban tiimi. He käyttivät hajota ja hallitse -menetelmää, jolla voi olla laaja vaikutus tekoälyagenttien opettamiseen tekemään monimutkaisia tehtäviä. Tämä on merkittävä saavutus, sillä tekoälytutkijat ovat aina pitäneet Ms. Pac-Mania vaikeimmin murtavien joukossa. Maluuba-tiimi kutsuu tässä järjestelmässä käytettyä tekniikkaa nimellä Hybrid Reward Architecture. Lue siitä tarkemmin alta,

Tämä tekniikka käyttää yli 150 agenttia, joista jokainen työskenteli rinnakkain muiden agenttien kanssa hallitakseen Ms. Pac-Manin. Esimerkiksi jotkut agentit saivat palkinnon yhden tietyn pelletin onnistuneesta löytämisestä, kun taas toisten tehtävänä oli pysyä poissa haamujen tieltä. Sitten tutkijat loivat huippuagentin – tavallaan kuin yrityksen ylemmän johtajan – joka otti ehdotuksia kaikilta agenteilta ja käytti niitä päättäessään, minne siirtää neiti Pac-Man.

Huippuagentti otti huomioon, kuinka moni agentti puolusti menemistä tiettyyn suuntaan, mutta se tarkasteli myös intensiteettiä, jolla he halusivat tehdä tämän liikkeen. Jos esimerkiksi 100 agenttia halusi mennä oikealle, koska se oli paras polku heidän pelletilleen, mutta kolme halusi mennä vasemmalle, koska oikealla oli tappava haamu, se antaisi enemmän painoarvoa niille, jotka olivat huomanneet haamun ja mene vasemmalle.

Tekniikka on erityisen mielenkiintoinen, koska monet monimutkaiset tehtävät, jotka normaalisti olisivat liian vaikeita koneoppimisjärjestelmille, voidaan jakaa useisiin yksittäisiin yksinkertaisempiin tehtäviin, millä on merkittäviä vaikutuksia sen työn määrään ja tyyppiin, jonka tekoäly voi pian syrjäyttää.

Lue lisää tästä tarinasta tätä.

Lisää aiheista: ai, Maluuban hybridipalkinto-arkkitehtuuri, microsoft, Rouva Pac-Man, vahvistaminen oppiminen

Pradeep Viswav

Ohjelmisto- ja palveluasiantuntija

Pradeep on tietojenkäsittelytieteen ja tekniikan tutkinnon suorittanut. Hän oli myös Microsoft Student Partner. Tällä hetkellä hän työskentelee johtavassa IT-yrityksessä.