谷歌的 Gemini AI 在圖像生成方面遇到了挫折,誓言要改進

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

重點說明

  • 有爭議的影像輸出凸顯了平衡大型語言模型的準確性和多樣性方面的挑戰。

谷歌 承認 Gemini AI 影像產生工具有缺陷,該功能產生的人物影像不準確且可能有害。該公司在修復過程中暫時暫停了該功能。爭議源於 Gemini 傾向於創建多樣化的圖像,即使用戶要求特定的歷史人物或場景也是如此。儘管本意是包容性的,但這導致了歷史上不準確、有時甚至令人反感的結果。

在一篇部落格文章中,高級副總裁 Prabhakar Raghavan 解釋了這些失誤,並誓言要改進這項技術。 「我們不希望雙子座拒絕創造任何特定群體的形象……[但]它會犯錯誤,」他寫道。

以下是 Google Gemini 的問題:

  • 谷歌為確保雙子座顯示一系列人而進行的調整未能解釋應該清楚說明的情況 任何監管機構都不批准 顯示一個範圍。
  • 隨著時間的推移,該模型變得比我們預想的更加謹慎,並且完全拒絕回答某些提示——錯誤地將一些非常鎮痛的提示解釋為敏感。
  • 這兩件事導致模型在某些情況下過度補償,而在其他情況下過度保守,導致圖像令人尷尬和錯誤。

AI 影像生成的挑戰:

這一事件突顯了人工智慧影像生成模型中平衡準確性和表示性所面臨的持續挑戰。谷歌的困境反映了其他流行圖像生成器的類似爭議。

有關主題的更多資訊: 雙子座, 谷歌