GPT4 gioca a DOOM, si dimentica dei nemici nel gioco ed è felice di prendere una pistola e iniziare a sparare

Icona del tempo di lettura 2 minuto. leggere


I lettori aiutano a supportare MSpoweruser. Potremmo ricevere una commissione se acquisti tramite i nostri link. Icona descrizione comando

Leggi la nostra pagina informativa per scoprire come puoi aiutare MSPoweruser a sostenere il team editoriale Per saperne di più

Note chiave

  • GPT-4V, una variante multimodale di GPT-4, può giocare a DOOM senza previo addestramento.
  • Il sistema utilizza screenshot per comprendere lo stato del gioco e un modello di agente per prendere decisioni.
  • GPT-4 ha difficoltà con la permanenza dell'oggetto e con la spiegazione delle sue azioni, fornendo a volte informazioni errate.
Doom Eternal di nuova generazione

Un recente articolo di ricerca di Adrian de Wynter, ricercatore presso l'Università di York in Inghilterra, ha esplorato le capacità di GPT4 nel giocare al classico gioco sparatutto in prima persona DOOM.

La carta, intitolata "GPT-4 eseguirà DOOM?" scopre se GPT4 può giocare senza previa formazione. Per testarlo, de Wynter ha progettato un sistema che utilizza GPT-4V, una variante multimodale di GPT4 che può accettare immagini come input, per catturare screenshot dal motore di gioco e restituire descrizioni strutturate dello stato del gioco. 

Queste informazioni vengono quindi inserite in un modello di agente che prende decisioni in base all'input visivo e alla cronologia precedente, traducendo le sue risposte in comandi da premere che il motore di gioco può comprendere. 

In parole più semplici, il sistema acquisisce screenshot del gioco e li usa per capire cosa sta succedendo. Quindi, utilizza un'altra parte del sistema, chiamata modello Agente, per prendere decisioni su cosa fare dopo nel gioco. Il modello Agente trasforma le sue decisioni in comandi comprensibili al gioco, come quali tasti premere.

Anche se il sistema si è mostrato promettente nel giocare a DOOM, ha anche rivelato alcune limitazioni. Uno dei problemi principali era 

  • La mancanza di permanenza degli oggetti in GPT4 significa che si dimentica dei nemici nel gioco quando escono dallo schermo. 
  • Inoltre, GPT4 ha faticato a ragionare e a fornire spiegazioni chiare per le sue azioni, fornendo spesso informazioni errate.

Nonostante queste limitazioni, de Wynter lo considera notevole GPT4 è in grado di riprodurre DOOM senza formazione preventiva. 

Maggiori informazioni sugli argomenti: Destino, GPT4