GPT4 玩《DOOM》,忘记了游戏中的敌人,高兴地拿起枪开始爆破

阅读时间图标 2分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

重点说明

  • GPT-4V 是 GPT-4 的多模式变体,无需事先训练即可玩《DOOM》。
  • 系统使用屏幕截图来了解游戏状态,并使用代理模型来做出决策。
  • GPT-4 与对象持久性和解释其行为作斗争,有时提供不正确的信息。
末日永恒的下一代

英国约克大学研究员 Adrian de Wynter 最近发表的一篇研究论文探讨了 GPT4 在玩经典第一人称射击游戏《DOOM》中的能力。

这篇论文的标题是“GPT-4 会运行《DOOM》吗?” 找出 GPT4 是否可以在没有事先训练的情况下玩游戏。为了测试这一点,de Wynter 设计了一个系统,该系统使用 GPT-4V(GPT4 的多模式变体),可以接受图像作为输入,从游戏引擎捕获屏幕截图并返回游戏状态的结构化描述。 

然后,这些信息被输入到代理模型中,该模型根据视觉输入和之前的历史记录做出决策,将其响应转换为游戏引擎可以理解的击键命令。 

简而言之,系统会截取游戏的屏幕截图并使用它们来弄清楚发生了什么。然后,它使用系统的另一部分(称为代理模型)来决定游戏中下一步要做什么。代理模型将其决策转化为游戏可以理解的命令,例如按哪些键。

虽然该系统在玩《DOOM》时表现出了良好的前景,但它也暴露出一些局限性。主要问题之一是 

  • GPT4 缺乏对象持久性,这意味着当游戏中的敌人离开屏幕时,它会忘记它们。 
  • 此外,GPT4 很难对其行为进行推理并提供清晰的解释,经常提供不正确的信息。

尽管存在这些限制,德温特认为值得注意的是 GPT4可以玩DOOM 未经事先培训。 

有关主题的更多信息: 厄运, GPT4

发表评论

您的电邮地址不会被公开。 必填带 *