GPT4 hrá DOOM, zabudne na nepriateľov v hre a rád schmatne zbraň a začne strieľať
2 min. čítať
Publikované dňa
Prečítajte si našu informačnú stránku a zistite, ako môžete pomôcť MSPoweruser udržať redakčný tím Čítaj viac
Kľúčové poznámky
-
GPT-4V, multimodálny variant GPT-4, dokáže hrať DOOM bez predchádzajúceho tréningu.
-
Systém používa snímky obrazovky na pochopenie stavu hry a model agenta na prijímanie rozhodnutí.
-
GPT-4 zápasí so stálosťou objektu a vysvetľuje svoje činnosti, pričom občas poskytuje nesprávne informácie.
Nedávna výskumná práca Adriana de Wyntera, výskumníka z University of York v Anglicku, skúmala možnosti GPT4 pri hraní klasickej strieľačky DOOM z pohľadu prvej osoby.
Papier s názvom „Spustí GPT-4 DOOM?“ zisťuje, či GPT4 dokáže hrať hru bez predchádzajúceho tréningu. Aby to de Wynter otestoval, navrhol systém, ktorý používa GPT-4V, multimodálny variant GPT4, ktorý môže prijímať obrázky ako vstup, na zachytenie snímok obrazovky z herného enginu a vrátenie štruktúrovaných popisov stavu hry.
Tieto informácie sa potom vložia do modelu agenta, ktorý sa rozhoduje na základe vizuálneho vstupu a predchádzajúcej histórie, pričom svoje odpovede prevádza do príkazov na stlačenie klávesov, ktorým herný engine rozumie.
Jednoduchšie povedané, systém robí screenshoty hry a používa ich, aby zistil, čo sa deje. Potom používa ďalšiu časť systému, nazývanú model agenta, na rozhodovanie o ďalšom postupe v hre. Model agenta premieňa svoje rozhodnutia na príkazy, ktorým hra rozumie, napríklad ktoré klávesy treba stlačiť.
Aj keď bol systém pri hraní DOOM sľubný, odhalil aj určité obmedzenia. Jedným z hlavných problémov bolo
- Nedostatok objektovej stálosti GPT4 znamená, že zabudne na nepriateľov v hre, keď zmiznú z obrazovky.
- GPT4 sa navyše snažil zdôvodniť a poskytnúť jasné vysvetlenia svojich činov, pričom často poskytoval nesprávne informácie.
Napriek týmto obmedzeniam to de Wynter považuje za pozoruhodné GPT4 je schopný hrať DOOM bez predchádzajúceho školenia.