Microsoft batte la signora Pac-Man utilizzando un esclusivo sistema di intelligenza artificiale multi-agente

Icona del tempo di lettura 2 minuto. leggere


I lettori aiutano a supportare MSpoweruser. Potremmo ricevere una commissione se acquisti tramite i nostri link. Icona descrizione comando

Leggi la nostra pagina informativa per scoprire come puoi aiutare MSPoweruser a sostenere il team editoriale Per saperne di più

Un sistema basato sull'intelligenza artificiale sviluppato da Microsoft ha ottenuto il punteggio massimo possibile per il gioco Ms. Pac-Man, 999,990. Questo sistema è stato sviluppato da un team di Maluuba, una startup canadese di deep learning acquisita da Microsoft all'inizio di quest'anno. Hanno utilizzato un metodo divide et impera che potrebbe avere ampie implicazioni per insegnare agli agenti di intelligenza artificiale a svolgere compiti complessi. Questo è un risultato significativo poiché i ricercatori di intelligenza artificiale hanno sempre trovato la signora Pac-Man tra le più difficili da decifrare. Il team di Maluuba chiama la tecnica utilizzata in questo sistema come Hybrid Reward Architecture. Leggilo in dettaglio di seguito,

Questa tecnica utilizza più di 150 agenti, ognuno dei quali ha lavorato in parallelo con gli altri agenti per padroneggiare la signora Pac-Man. Ad esempio, alcuni agenti sono stati premiati per aver trovato con successo una pallina specifica, mentre altri hanno avuto il compito di stare alla larga dai fantasmi. Quindi, i ricercatori hanno creato un agente di alto livello, una sorta di senior manager di un'azienda, che ha preso suggerimenti da tutti gli agenti e li ha usati per decidere dove spostare la signora Pac-Man.

L'agente di punta ha tenuto conto di quanti agenti hanno sostenuto di andare in una certa direzione, ma ha anche esaminato l'intensità con cui volevano fare quella mossa. Ad esempio, se 100 agenti volessero andare a destra perché quello era il percorso migliore per il loro pellet, ma tre volessero andare a sinistra perché c'era un fantasma mortale a destra, darebbe più peso a quelli che hanno notato il fantasma e andate a sinistra.

La tecnica è particolarmente interessante perché molti compiti complessi che normalmente sarebbero troppo difficili da assumere per i sistemi di apprendimento automatico possono essere suddivisi in più compiti individuali più semplici, con implicazioni significative per la quantità e il tipo di lavoro che l'IA sarà presto in grado di sostituire.

Leggi di più su questa storia qui.

Maggiori informazioni sugli argomenti: ai, L'architettura ibrida delle ricompense di Maluuba, microsoft, Ms. Pac-Man, insegnamento rafforzativo