Google VLOGGER AI 透過栩栩如生的會說話的頭像讓照片變得栩栩如生

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

重點說明

  • 谷歌人工智慧從單張照片創造出栩栩如生的會說話的頭像。
  • VLOGGER 使用擴散模型來逼真地製作照片動畫。
  • 潛在的應用包括 VR 頭像和視訊配音。

谷歌研究人員開發了一種名為 VLOGGER 的新人工智慧系統,可以產生人們說話、手勢和動作的逼真視頻 來自一張靜態照片。

這項技術在題為「VLOGGER:用於體現化身合成的多模態擴散」的研究論文中進行了描述,它利用擴散模型,這是一種擅長從文本描述創建圖像的機器學習類型。透過將這項技術應用於影片並在海量資料集上進行訓練,VLOGGER 可以以非常令人信服的方式製作照片動畫。

與先前的工作相比,我們的方法不需要對每個人進行訓練,不依賴臉部偵測和裁剪,產生完整的影像(不僅僅是臉部或嘴唇),並考慮廣泛的場景(例如可見的軀幹)或不同的主體身份),這對於正確合成進行交流的人類至關重要。

作者寫道。

VLOGGER 的功能包括自動為不同語言的視頻配音、編輯視頻,甚至從單一圖像創建完整視頻。

研究人員聲稱 VLOGGER 在影像品質和真實感方面優於其他方法。隨著這項技術的進步,真實影片和人造影片之間的界線可能會變得模糊。 VLOGGER 讓我們一睹人工智慧的未來。

然而,人們對潛在的濫用存在擔憂。隨著 VLOGGER 不斷完善自己的能力,製作 Deepfakes 的難度也在不斷提高——用另一個人的肖像取代一個人的肖像的視頻,例如 發生在泰勒絲身上。

您可以查看範例 点击這裡.

發表評論

您的電子郵件地址將不會被發表。 必填字段標 *