微软在机器人上试用 ChatGPT,结果令人印象深刻

阅读时间图标 3分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

微软的研究人员最近 测试 机器人手臂、无人机和家庭助理机器人上的 ChatGPT。 该公司表示,该实验的总体结论取得了优异的成绩,预示着 ChatGPT 在机器人领域的光明前景。

ChatGPT的到来标志着全球现代人工智能时代的诞生。 在微软宣布将 AI 语言模型集成到 , 其他公司如 谷歌 开始分享他们自己围绕技术的作品。 几个,不多;屈指可数 中国企业 据报道,他们也在研究和开发自己的类似 ChatGPT 的项目。 有了这个,微软已经意识到保持领先地位的唯一方法是继续前进并将 ChatGPT 应用于其他领域:机器人技术。

在 Microsoft Autonomous Systems and Robotics Research Group 共享的工作中, ChatGPT 使用不同的平台被赋予各种任务。 测试还涉及不同的设计原则,包括特殊的提示结构、高级 API 和通过文本的人工反馈。 该组织报告说,虽然该技术“仍然需要一些帮助”,但该项目的结果证明“ChatGPT 本身可以做很多事情。”

“通过遵循我们的一套设计原则,ChatGPT 可以为机器人场景生成代码,”该小组分享道。 “在没有任何微调的情况下,我们利用 LLM(大型语言模型)的知识来控制不同形状的机器人来完成各种任务。”

该项目中执行的一项测试涉及将 ChatGPT 控制权交给无人机和 Microsoft AirSim 模拟器。 在共享的一些视频中,ChatGPT 能够执行从寻找饮料、根据描述识别饮料以及建议“健康选择”等命令。 它还成功地按照文本命令在反光表面前自拍并检查了割草机图案的架子。 当用于模拟工业检查场景时,研究人员报告了空中避障测试的良好结果,并补充说它“能够有效解析用户的高级意图和几何线索,以准确控制无人机。”

在更令人难以置信的场景中,ChatGPT 通过堆叠块并借助其知识库使用它们创建微软的四色徽标,从而通过了操纵测试。

“我们使用对话反馈来教模型如何将最初提供的 API 组合成更复杂的高级功能:ChatGPT 自行编码,”该小组解释说。 “......该模型展示了一个迷人的例子,当任务是用木块构建微软徽标时,桥接文本域和物理域。 它不仅能够从其内部知识库中调用徽标,还能“绘制”徽标(作为 SVG 代码),然后使用上面学到的技能找出哪些现有机器人动作可以构成其物理形式。 ”

虽然该项目的结果看起来很有希望,但微软强调,这项工作“只是机器人使用大型语言模型时可以完成的事情的一小部分”。 此外,该公司提醒称,ChatGPT 尚未完全准备好帮助机器人执行任务,警告爱好者和其他研究人员“始终采取必要的安全预防措施”。

有关主题的更多信息: ai, 人工智能, ChatGPT, 微软研究, 开放AI

发表评论

您的电邮地址不会被公开。 必填带 *