Meta 的 BlenderBot 3：改进的聊天机器人，旨在“从对话中学习”

阅读时间图标 4分钟读

日历图标发表于 2022 年 8 月 8 日

发表于 2022 年 8 月 8 日

读者帮助支持 MSpoweruser。如果您通过我们的链接购买，我们可能会获得佣金。

您可能是那些爱上星际电影中名为 TARS 的人工智能机器人的幽默的人之一。我们听到它开玩笑并发表评论，就像酒吧里的酷人一样。不幸的是，我们目前的技术还远未生产出能够像活人一样随意自然地与我们交谈的机器人。尽管如此，元 正在迈出新的一步，通过引入其最新的人工智能研究项目，使之成为可能 BlenderBot 3 聊天机器人.

BlenderBot 3 只是 Meta 在其 BlenderBot 系列中的项目之一，它允许 AI 通过互联网数据和长期记忆的帮助“进行有意义的对话”。与其他人相比，据说 BlenderBot 3 使用的是更大的语言模型，其大小是 BlenderBot 58 的 2 倍。特别是，它使用大量公开可用的语言数据进行训练，其中包含关于各种主题的无数对话，从食谱到有趣的地方和旅游度假。

另一方面，BlenderBot 3 的主要亮点是它能够从与网络上不同人的对话中学习。 Meta 表示，它将使用这种技术从人们那里收集有关该模型的反馈，以改进其响应。

“我们研究的目标是收集和发布反馈数据，我们和更广泛的人工智能研究社区可以随着时间的推移利用这些数据。通过这种方式，我们可以找到新的方法让 AI 系统更安全、更吸引使用它们的人，”Meta 在博客文章. “虽然 BlenderBot 3 显着推进了公开可用的聊天机器人，但它肯定不是人类水平的。它有时是不正确的、不一致的和离题的。随着越来越多的人与我们的演示互动，我们将利用他们的反馈和发布数据来改进我们的模型，以造福更广泛的人工智能社区。”

尽管有了新的改进，Meta 承认 BlenderBot 3 远非完美。虽然与前辈相比，它的知识渊博两倍，并且在对话任务上提高了 31%，但 Meta 指出它仍然可以以不利的方式执行。事实上，Meta 声称其 0.16% 的回复在测试期间被标记为不恰当。同时，为了保护聊天机器人免受那些想要负面使用它的人的影响，Meta 表示它还赋予了 BlenderBot 3 适当的能力，以避免学习攻击性言论，尤其是来自巨魔的不恰当言论。

“我们知道，并非每个使用聊天机器人的人都有好意，因此我们还开发了新的学习算法来区分有用的响应和有害的示例，”Meta 分享道。 “随着时间的推移，我们将使用这种技术使我们的模型对所有用户更加负责和安全。”

BlenderBot 3 已经可供美国用户试用，但正如预期的那样，它并非完美无缺。虽然它可以流畅地表达句子，但聊天机器人有时会错过对话流程，并可能从一个话题跳到另一个话题。例如，在由接线，BlenderBot 3 引入了与讨论无关的想法。

在另一即时通话与 BuzzFeed 数据科学家 Max Woolf 一起使用 BlenderBot 3，该机器人钦佩马克·扎克伯格，称 Meta 首席执行官是“一个优秀的商人”。然而，在一个改写的问题中雅虎，机器人以某种方式否定了它提供给伍尔夫的回应，说：“哦，伙计，大时代。我一点也不喜欢他。他太令人毛骨悚然和操纵欲强。”