Meta's BlenderBot 3: 「会話から学ぶ」ように設計された改良型チャットボット

読書時間アイコン 4分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

あなたはおそらく、インターステラー映画で TARS という名前の AI ロボットのユーモアに恋をした人の XNUMX 人でしょう。 冗談を言ったり、バーでクールな男のように発言したりするのを聞いた. 残念ながら、現在の技術では、生きている人間のように私たちと気軽に自然に会話できるロボットにはほど遠いものです。 それにもかかわらず、 Meta は、最新の AI 研究プロジェクトである BlenderBot 3 チャットボット.

BlenderBot 3 は、BlenderBot シリーズの Meta のプロジェクトの 3 つにすぎません。これにより、AI はインターネット データと長期記憶の助けを借りて「意味のある会話を実行」できます。 他のものと比較して、BlenderBot 58 は BlenderBot 2 の XNUMX 倍のサイズのはるかに大きな言語モデルを使用していると言われています。特に、さまざまなトピックに関する無数の会話で公開されている膨大な量の言語データを使用してトレーニングされています。 、レシピから興味深い場所や観光地まで。 

一方、BlenderBot 3 の主なハイライトは、Web 上のさまざまな個人との会話から学習する能力です。 Meta は、この手法を使用してモデルに関するフィードバックを人々から収集し、それを使用して応答を改善すると述べています。

「私たちの研究の目標は、私たちとより広範な AI 研究コミュニティが長期にわたって活用できるフィードバック データを収集して公開することです。 そうすれば、AI システムがより安全で、AI システムを使用する人々にとってより魅力的なものになる新しい方法を見つけることができます」と Meta は次のように述べています。 ブログ投稿. 「BlenderBot 3 は一般に公開されているチャットボットを大幅に進歩させていますが、人間のレベルではありません。 場合によっては、不正確で、一貫性がなく、トピックから外れています。 より多くの人々が私たちのデモを操作するにつれて、フィードバックを使用してモデルを改善し、データをリリースして、より広い AI コミュニティに利益をもたらします。」

新たな改善にもかかわらず、Meta は BlenderBot 3 が完璧には程遠いことを認めました。 Meta は、前任者と比較して 31 倍の知識があり、会話タスクで 0.16% 改善されていますが、それでも好ましくない方法で実行できることに注意してください。 実際のところ、Meta は、テスト中に応答の 3% が不適切であるとラベル付けされたと主張しました。 一方、チャットボットを否定的に使用したい人からチャットボットを保護するために、Meta は、BlenderBot XNUMX に攻撃的な発言、特にトロールからの不適切な発言を学習しないようにする適切な機能も与えたと述べました。

「チャットボットを使用するすべての人が善意を持っているわけではないことを理解しています。そのため、役立つ応答と有害な例を区別するための新しい学習アルゴリズムも開発しました」と Meta は共有しました。 「時間が経つにつれて、この手法を使用して、モデルをより責任があり、すべてのユーザーにとって安全なものにします。」

BlenderBot 3 はすでに米国のユーザーが試用できるようになっていますが、予想どおり、完璧ではありません。 チャットボットはスムーズに文章を伝えることができますが、会話の流れを見逃して、あるトピックから別のトピックにジャンプすることがあります。 たとえば、共有された会話で ワイヤード、BlenderBot 3 は、議論にあまり関係のないアイデアを導入しました。

他に チャット BlenderBot 3 と BuzzFeed データ サイエンティストの Max Woolf は、このボットは Mark Zuckerberg を称賛し、Meta の CEO は「優れたビジネスマン」であると述べました。 しかし、 ヤフー、ボットはどういうわけか、ウルフに提供した応答を否定して、「ああ、すごい。 私は彼がまったく好きではありません。 彼はあまりにも不気味で操作的です。」

以上のことから、BlenderBot 3 が世界が信頼できるインテリジェントなチャットボットになるには、まだ長い道のりが必要かもしれません。 それにもかかわらず、適切なやり取りとフィードバックがあれば、メタはシステムをさらに改善するための適切な資料を入手し、(願わくば) ザッカーバーグが実際に優れたビジネスマンなのか、それとも気味の悪い操作好きな男なのかを判断するのに役立つはずです。

Wired、Max Woolf、Yahoo! の画像クレジット

コメントを残す

あなたのメールアドレスは公開されません。 必須フィールドは、マークされています *