Microsoft pobjeđuje gospođu Pac-Man koristeći jedinstveni sustav umjetne inteligencije s više agenata

Ikona vremena čitanja 2 min. čitati


Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza. Ikona opisa alata

Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više

Sustav temeljen na umjetnoj inteligenciji koji je razvio Microsoft postigao je najveći mogući rezultat za igru ​​Ms. Pac-Man, 999,990. Ovaj sustav razvio je tim u Maluubi, kanadskom startupu za duboko učenje koji je Microsoft kupio ranije ove godine. Koristili su metodu zavadi pa vladaj koja bi mogla imati široke implikacije za podučavanje AI agenata obavljanju složenih zadataka. Ovo je značajno postignuće budući da su istraživači umjetne inteligencije uvijek smatrali gospođu Pac-Man među onima koje je najteže razbiti. Tim Maluuba tehniku ​​korištenu u ovom sustavu naziva Hibridnom arhitekturom nagrada. Pročitajte o tome detaljno u nastavku,

Ova tehnika koristi više od 150 agenata, od kojih je svaki radio paralelno s drugim agentima kako bi svladao gospođu Pac-Man. Na primjer, neki agenti su nagrađeni za uspješno pronalaženje jedne određene kuglice, dok su drugi imali zadatak da se drže podalje od duhova. Zatim su istraživači stvorili vrhunskog agenta – nešto poput višeg menadžera u tvrtki – koji je uzimao prijedloge svih agenata i koristio ih kako bi odlučio kamo premjestiti gospođu Pac-Man.

Vrhunski agent uzeo je u obzir koliko se agenata zalaže za odlazak u određenom smjeru, ali je gledao i na intenzitet kojim su željeli napraviti taj potez. Na primjer, ako je 100 agenata htjelo ići desno jer je to bio najbolji put do njihove kuglice, ali tri su htjela ići lijevo jer je s desne strane bio smrtonosni duh, to bi dalo veću težinu onima koji su primijetili duha i ici lijevo.

Tehnika je posebno zanimljiva jer se mnogi složeni zadaci koji bi inače bili preteški za sustave strojnog učenja mogu razvrstati na više pojedinačnih jednostavnijih zadataka, sa značajnim implikacijama na količinu i vrstu posla koje će AI uskoro moći zamijeniti.

Pročitajte više o ovoj priči ovdje.

Više o temama: ai, Maluubina hibridna arhitektura nagrađivanja, Microsoft, Gospođice Pac-Man, učenje učvršćivanja