GoogleのGemini AI、画像生成でつまずき、改善を誓う

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

キーノート

  • 物議を醸している画像出力は、大規模な言語モデルの精度と多様性のバランスをとる際の課題を浮き彫りにしています。

グーグル 認め 同社は、AI画像生成ツール「ジェミニ」の欠陥について、不正確で潜在的に有害な人物画像を生成したことで批判した。同社は修正作業中、この機能を一時的に停止している。この論争は、ユーザーが特定の歴史上の人物やシナリオをリクエストした場合でも、ジェミニが多様な画像を作成する傾向があることに端を発している。包括的であることを意図していたにもかかわらず、これは歴史的に不正確で、時には不快な結果につながった。

プラバカール・ラガバン上級副社長はブログ投稿で今回の失敗について説明し、技術を改善すると誓った。 「私たちはジェミニが特定のグループのイメージを作成することを拒否したくありませんでした…[しかし]それは間違いを犯すでしょう」と彼は書いています。

Google Gemini の問題点は次のとおりです。

  • ジェミニが明らかにすべきケースを明らかに説明できていないことを明らかにするためのGoogleの調整   範囲を示します。
  • 時間が経つにつれて、モデルは私たちが意図したよりもはるかに慎重になり、特定のプロンプトに完全に答えることを拒否し、非常に異常なプロンプトを敏感なものとして誤って解釈しました。
  • これら 2 つのことにより、モデルはある場合には過剰に補正し、別の場合には過度に保守的になり、恥ずかしい画像や間違った画像が生成されてしまいました。

AI 画像生成の課題:

このインシデントは、AI 画像生成モデルの精度と表現のバランスをとるという継続的な課題を浮き彫りにしました。 Googleの苦戦は、他の人気のある画像生成会社との同様の論争を反映している。

ユーザーフォーラム

1メッセージ