GPT4 hraje DOOM, zapomene na nepřátele ve hře a rád popadne zbraň a začne střílet
2 min. číst
Publikované dne
Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více
Klíčové poznámky
-
GPT-4V, multimodální varianta GPT-4, může hrát DOOM bez předchozího tréninku.
-
Systém používá snímky obrazovky k pochopení stavu hry a model agenta k rozhodování.
-
GPT-4 se potýká se stálostí objektu a vysvětlováním jeho akcí, přičemž občas poskytuje nesprávné informace.
Nedávný výzkumný článek Adriana de Wyntera, výzkumníka z University of York v Anglii, prozkoumal možnosti GPT4 při hraní klasické střílečky z pohledu první osoby DOOM.
List s názvem „Spustí GPT-4 DOOM?“ zjišťuje, zda GPT4 může hrát hru bez předchozího tréninku. Aby to de Wynter otestoval, navrhl systém, který používá GPT-4V, multimodální variantu GPT4, která může přijímat obrázky jako vstup, k zachycení snímků obrazovky z herního enginu a vrácení strukturovaných popisů stavu hry.
Tyto informace jsou pak vloženy do modelu agenta, který se rozhoduje na základě vizuálního vstupu a předchozí historie a převádí své reakce do příkazů pro stisknutí kláves, kterým herní engine rozumí.
Jednoduše řečeno, systém pořizuje snímky obrazovky hry a používá je k tomu, aby zjistil, co se děje. Poté používá další část systému, nazývanou model agenta, k rozhodování o dalším postupu ve hře. Model agenta mění svá rozhodnutí na příkazy, kterým hra rozumí, například jaké klávesy stisknout.
Zatímco systém byl při hraní DOOM slibný, odhalil také některá omezení. Jedním z hlavních problémů bylo
- Nedostatek objektové stálosti GPT4 znamená, že zapomene na nepřátele ve hře, když odejdou mimo obrazovku.
- Kromě toho se GPT4 snažil zdůvodnit a poskytnout jasné vysvětlení svých akcí, přičemž často poskytoval nesprávné informace.
Navzdory těmto omezením to de Wynter považuje za pozoruhodné GPT4 je schopen hrát DOOM bez předchozího školení.