Google VLOGGER AI 透過栩栩如生的會說話的頭像讓照片變得栩栩如生

閱讀時間圖標 2分鐘讀

日曆圖標發表於 2024 年 3 月 18 日

發表於 2024 年 3 月 18 日

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

重點說明

谷歌研究人員開發了一種名為 VLOGGER 的新人工智慧系統，可以產生人們說話、手勢和動作的逼真視頻 來自一張靜態照片。

這項技術在題為「VLOGGER：用於體現化身合成的多模態擴散」的研究論文中進行了描述，它利用擴散模型，這是一種擅長從文本描述創建圖像的機器學習類型。透過將這項技術應用於影片並在海量資料集上進行訓練，VLOGGER 可以以非常令人信服的方式製作照片動畫。

與先前的工作相比，我們的方法不需要對每個人進行訓練，不依賴臉部偵測和裁剪，產生完整的影像（不僅僅是臉部或嘴唇），並考慮廣泛的場景（例如可見的軀幹）或不同的主體身份），這對於正確合成進行交流的人類至關重要。

作者寫道。

VLOGGER 的功能包括自動為不同語言的視頻配音、編輯視頻，甚至從單一圖像創建完整視頻。

研究人員聲稱 VLOGGER 在影像品質和真實感方面優於其他方法。隨著這項技術的進步，真實影片和人造影片之間的界線可能會變得模糊。 VLOGGER 讓我們一睹人工智慧的未來。

然而，人們對潛在的濫用存在擔憂。隨著 VLOGGER 不斷完善自己的能力，製作 Deepfakes 的難度也在不斷提高——用另一個人的肖像取代一個人的肖像的視頻，例如發生在泰勒絲身上。

您可以查看範例点击這裡.

德韋什·貝裡

科技記者

這些是激勵我的事情 - 創造資訊豐富且有用的內容，追求我對賽車運動和音樂的熱情，參與探險，保持健康的生活方式，以及與我可愛的貓 Taco 共度時光。