Microsoft pobjeđuje gospođu Pac-Man koristeći jedinstveni sustav umjetne inteligencije s više agenata

Ikona vremena čitanja 2 min. čitati

Ikona kalendara Objavljeno na Lipnja 14, 2017

objavljeno Lipnja 14, 2017

Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza.

Sustav temeljen na umjetnoj inteligenciji koji je razvio Microsoft postigao je najveći mogući rezultat za igru Ms. Pac-Man, 999,990. Ovaj sustav razvio je tim u Maluubi, kanadskom startupu za duboko učenje koji je Microsoft kupio ranije ove godine. Koristili su metodu zavadi pa vladaj koja bi mogla imati široke implikacije za podučavanje AI agenata obavljanju složenih zadataka. Ovo je značajno postignuće budući da su istraživači umjetne inteligencije uvijek smatrali gospođu Pac-Man među onima koje je najteže razbiti. Tim Maluuba tehniku korištenu u ovom sustavu naziva Hibridnom arhitekturom nagrada. Pročitajte o tome detaljno u nastavku,

Ova tehnika koristi više od 150 agenata, od kojih je svaki radio paralelno s drugim agentima kako bi svladao gospođu Pac-Man. Na primjer, neki agenti su nagrađeni za uspješno pronalaženje jedne određene kuglice, dok su drugi imali zadatak da se drže podalje od duhova. Zatim su istraživači stvorili vrhunskog agenta – nešto poput višeg menadžera u tvrtki – koji je uzimao prijedloge svih agenata i koristio ih kako bi odlučio kamo premjestiti gospođu Pac-Man.

Vrhunski agent uzeo je u obzir koliko se agenata zalaže za odlazak u određenom smjeru, ali je gledao i na intenzitet kojim su željeli napraviti taj potez. Na primjer, ako je 100 agenata htjelo ići desno jer je to bio najbolji put do njihove kuglice, ali tri su htjela ići lijevo jer je s desne strane bio smrtonosni duh, to bi dalo veću težinu onima koji su primijetili duha i ici lijevo.

Tehnika je posebno zanimljiva jer se mnogi složeni zadaci koji bi inače bili preteški za sustave strojnog učenja mogu razvrstati na više pojedinačnih jednostavnijih zadataka, sa značajnim implikacijama na količinu i vrstu posla koje će AI uskoro moći zamijeniti.

Pročitajte više o ovoj priči ovdje.

Više o temama: ai, Maluubina hibridna arhitektura nagrađivanja, Microsoft, Gospođice Pac-Man, učenje učvršćivanja

Pradeep Viswav

Stručnjak za softver i usluge

Pradeep je diplomirao računarstvo i inženjerstvo. Bio je i Microsoftov studentski partner. Trenutno radi u vodećoj IT tvrtki.