GPT4 gra w DOOM-a, zapomina o wrogach w grze i chętnie chwyta za broń i zaczyna strzelać

Ikona czasu czytania 2 minuta. czytać


Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków. Ikona podpowiedzi

Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej

Kluczowe uwagi

  • GPT-4V, multimodalny wariant GPT-4, pozwala grać w DOOM-a bez wcześniejszego szkolenia.
  • System wykorzystuje zrzuty ekranu do zrozumienia stanu gry i modelu Agenta do podejmowania decyzji.
  • GPT-4 zmaga się z trwałością obiektu i wyjaśnianiem jego działania, podając czasami błędne informacje.
Doom Eternal następna generacja

W niedawnym artykule badawczym Adriana de Wyntera, badacza z Uniwersytetu w Yorku w Anglii, zbadano możliwości GPT4 w grze w klasyczną strzelankę pierwszoosobową DOOM.

Artykuł zatytułowany „Czy GPT-4 uruchomi DOOM-a?” dowiaduje się, czy GPT4 może grać w grę bez wcześniejszego szkolenia. Aby to przetestować, de Wynter zaprojektował system wykorzystujący GPT-4V, multimodalny wariant GPT4, który może przyjmować obrazy jako dane wejściowe w celu przechwytywania zrzutów ekranu z silnika gry i zwracania uporządkowanych opisów stanu gry. 

Informacje te są następnie wprowadzane do modelu Agenta, który podejmuje decyzje w oparciu o dane wizualne i poprzednią historię, tłumacząc swoje reakcje na polecenia naciśnięcia klawiszy zrozumiałe dla silnika gry. 

Mówiąc prościej, system wykonuje zrzuty ekranu z gry i wykorzystuje je, aby dowiedzieć się, co się dzieje. Następnie wykorzystuje inną część systemu, zwaną modelem Agenta, do podejmowania decyzji o tym, co dalej robić w grze. Model Agenta przekształca swoje decyzje w polecenia zrozumiałe dla gry, np. które klawisze nacisnąć.

Chociaż system okazał się obiecujący w grze w DOOM, ujawnił także pewne ograniczenia. Jednym z głównych problemów było 

  • Brak trwałości obiektów w GPT4 oznacza, że ​​zapomina o wrogach w grze, gdy znikają z ekranu. 
  • Ponadto GPT4 miał trudności z uzasadnieniem i jasnym wyjaśnieniem swoich działań, często podając nieprawidłowe informacje.

Pomimo tych ograniczeń de Wynter uważa to za niezwykłe GPT4 obsługuje grę w DOOM-a bez wcześniejszego szkolenia. 

Więcej na tematy: Fatum, GPT4