Google VLOGGER AI は、本物そっくりに話すアバターで写真に命を吹き込みます
2分。 読んだ
更新日
MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む
キーノート
- Google AI は、1 枚の写真から本物そっくりに話すアバターを作成します。
- VLOGGER は拡散モデルを使用して写真をリアルにアニメーション化します。
- 潜在的な用途としては、VR アバターやビデオの吹き替えなどが挙げられます。
![](https://mspoweruser.com/wp-content/uploads/2024/03/New_Project_1-transformed-1-700x395.webp)
Googleの研究者は、人々が話したり、ジェスチャーをしたり、動いたりするリアルなビデオを生成できるVLOGGERと呼ばれる新しいAIシステムを開発しました。 たった一枚の静止画から。
「VLOGGER: 身体化されたアバター合成のためのマルチモーダル拡散」というタイトルの研究論文で説明されているこのテクノロジーは、テキストの説明から画像を作成することに優れた機械学習の一種である拡散モデルを活用しています。この技術をビデオに適用し、大規模なデータセットでトレーニングすることにより、VLOGGER は非常に説得力のある方法で写真をアニメーション化できます。
以前の研究とは対照的に、私たちの方法は各人物のトレーニングを必要とせず、顔の検出やトリミングに依存せず、完全な画像(顔や唇だけでなく)を生成し、広範囲のシナリオ(可視胴体など)を考慮します。コミュニケーションを行う人間を正しく統合するために重要です。
著者らは書いた。
![](https://mspoweruser.com/wp-content/uploads/2024/03/method-1200x507.png)
VLOGGER の機能には、さまざまな言語でのビデオの自動吹き替え、ビデオの編集、さらには 1 つの画像から完全なビデオの作成が含まれます。
研究者は、VLOGGER が画質とリアリズムの点で他の方法よりも優れていると主張しています。このテクノロジーが進歩するにつれて、本物のビデオと人工的なビデオの境界線が曖昧になる可能性があります。 VLOGGER は AI の未来を垣間見ることができます。
ただし、悪用の可能性については懸念があります。 VLOGGER の能力が向上するにつれて、ディープフェイク (人の似姿を別の人の似顔絵に置き換える動画) の作成も容易になります。 テイラー・スウィフトで起こった。
例を表示できます こちら.
ユーザーフォーラム
0メッセージ