GPT4 は DOOM をプレイし、ゲーム内の敵のことなど忘れ、喜んで銃を手に取り爆破を始めます

ホーム » ニュース

読書時間アイコン 2分。読んだ

カレンダーアイコン上で公開 2024 年 3 月 12 日

by デベシュ・ベリ

上の公表 2024 年 3 月 12 日

読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。

キーノート

GPT-4 のマルチモーダル版である GPT-4V は、事前のトレーニングなしで DOOM をプレイできます。
システムはスクリーンショットを使用してゲームの状態を理解し、エージェントモデルを使用して意思決定を行います。
GPT-4 はオブジェクトの永続性とその動作の説明に苦労しており、時々誤った情報を提供します。

イギリスのヨーク大学の研究者であるエイドリアン・デ・ウィンター氏による最近の研究論文では、古典的な一人称シューティングゲーム DOOM のプレイにおける GPT4 の機能が調査されています。

「GPT-4 は DOOM を実行しますか?」は、GPT4 が事前のトレーニングなしでゲームをプレイできるかどうかを調べます。これをテストするために、de Wynter は、画像を入力として受け入れることができる GPT4 のマルチモーダルバリアントである GPT-4V を使用して、ゲームエンジンからスクリーンショットをキャプチャし、ゲーム状態の構造化された説明を返すシステムを設計しました。

この情報はその後、視覚的な入力と以前の履歴に基づいて意思決定を行うエージェントモデルに入力され、その応答がゲームエンジンが理解できるキーストロークコマンドに変換されます。

簡単に言うと、システムはゲームのスクリーンショットを取得し、それを使用して何が起こっているかを把握します。次に、エージェントモデルと呼ばれるシステムの別の部分を使用して、ゲーム内で次に何を行うかを決定します。エージェントモデルは、その決定を、どのキーを押すかなど、ゲームが理解できるコマンドに変換します。

このシステムは『DOOM』のプレイに有望であることを示しましたが、いくつかの限界も明らかになりました。主な問題の 1 つは、

GPT4 にはオブジェクトの永続性がないため、ゲーム内の敵が画面外に出ると忘れてしまいます。
さらに、GPT4 はその動作を推論して明確に説明するのに苦労し、誤った情報を提供することがよくありました。

こうした制限にもかかわらず、デ・ウィンター氏は次の点が注目に値すると考えています。 GPT4 は DOOM をプレイできます事前のトレーニングなしで。

トピックの詳細: 運命, GPT4

デベシュ・ベリ

技術ジャーナリスト

有益で役立つコンテンツを作成すること、モータースポーツと音楽への情熱を追求すること、遠征に参加すること、健康的なライフスタイルを維持すること、そして愛猫のタコスと時間を過ごすこと、これらが私を動かす原動力です。