Meta 的 BlenderBot 3：改進的聊天機器人，旨在“從對話中學習”

閱讀時間圖標 4分鐘讀

日曆圖標發表於 2022 年 8 月 8 日

發表於 2022 年 8 月 8 日

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

您可能是那些愛上星際電影中名為 TARS 的人工智能機器人的幽默的人之一。我們聽到它開玩笑並發表評論，就像酒吧里的酷人一樣。不幸的是，我們目前的技術還遠未生產出能夠像活人一樣隨意自然地與我們交談的機器人。儘管如此， Meta 正在邁出新的一步，通過引入其最新的人工智能研究項目，使之成為可能 BlenderBot 3 聊天機器人.

BlenderBot 3 只是 Meta 在其 BlenderBot 系列中的項目之一，它允許 AI 通過互聯網數據和長期記憶的幫助“進行有意義的對話”。與其他人相比，據說 BlenderBot 3 使用的是更大的語言模型，其大小是 BlenderBot 58 的 2 倍。特別是，它使用大量公開可用的語言數據進行訓練，其中包含關於各種主題的無數對話，從食譜到有趣的地方和旅遊度假。

另一方面，BlenderBot 3 的主要亮點是它能夠從與網絡上不同人的對話中學習。 Meta 表示，它將使用這種技術從人們那裡收集有關該模型的反饋，以改進其響應。

“我們研究的目標是收集和發布反饋數據，我們和更廣泛的人工智能研究社區可以隨著時間的推移利用這些數據。通過這種方式，我們可以找到新的方法讓 AI 系統更安全、更吸引使用它們的人，”Meta 在博客文章. “雖然 BlenderBot 3 顯著推進了公開可用的聊天機器人，但它肯定不是人類水平的。它有時是不正確的、不一致的和離題的。隨著越來越多的人與我們的演示互動，我們將利用他們的反饋和發布數據來改進我們的模型，以造福更廣泛的人工智能社區。”

儘管有了新的改進，Meta 承認 BlenderBot 3 遠非完美。雖然與前輩相比，它的知識水平提高了兩倍，並且在對話任務上提高了 31%，但 Meta 指出它仍然可以以不利的方式執行。事實上，Meta 聲稱其 0.16% 的回复在測試期間被標記為不恰當。同時，為了保護聊天機器人免受那些想要負面使用它的人的影響，Meta 表示它還賦予了 BlenderBot 3 適當的能力，以避免學習攻擊性言論，尤其是來自巨魔的不恰當言論。

“我們知道，並非每個使用聊天機器人的人都有好意，因此我們還開發了新的學習算法來區分有用的響應和有害的示例，”Meta 分享道。 “隨著時間的推移，我們將使用這種技術使我們的模型對所有用戶更加負責和安全。”

BlenderBot 3 已經可供美國用戶試用，但正如預期的那樣，它並非完美無缺。雖然它可以流暢地表達句子，但聊天機器人有時會錯過對話流程，並可能從一個話題跳到另一個話題。例如，在由有線，BlenderBot 3 引入了與討論無關的想法。

在另一個館員諮詢與 BuzzFeed 數據科學家 Max Woolf 合作的 BlenderBot 3，該機器人欽佩馬克扎克伯格，稱 Meta 首席執行官是“一個好商人”。然而，在一個改寫的問題中雅虎，機器人以某種方式否定了它提供給伍爾夫的回應，說：“哦，伙計，大時代。我一點也不喜歡他。他太令人毛骨悚然和操縱慾強。”