Google VLOGGER AI menghidupkan foto dengan avatar berbicara yang nyata

Ikon waktu membaca 2 menit Baca


Pembaca membantu dukungan MSpoweruser. Kami mungkin mendapat komisi jika Anda membeli melalui tautan kami. Ikon Keterangan Alat

Baca halaman pengungkapan kami untuk mengetahui bagaimana Anda dapat membantu MSPoweruser mempertahankan tim editorial Baca lebih lanjut

Catatan kunci

  • Google AI menciptakan avatar berbicara yang nyata dari satu foto.
  • VLOGGER menggunakan model difusi untuk menganimasikan foto secara realistis.
  • Aplikasi potensial termasuk avatar VR dan dubbing video.

Peneliti Google telah mengembangkan sistem AI baru yang disebut VLOGGER yang dapat menghasilkan video realistis tentang orang yang berbicara, memberi isyarat, dan bergerak hanya dari satu foto diam.

Teknologi ini, dijelaskan dalam makalah penelitian berjudul “VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis,” memanfaatkan model difusi, sejenis pembelajaran mesin yang unggul dalam membuat gambar dari deskripsi teks. Dengan menerapkan teknologi ini pada video dan melatihnya pada kumpulan data yang sangat besar, VLOGGER dapat menganimasikan foto dengan cara yang sangat meyakinkan.

Berbeda dengan penelitian sebelumnya, metode kami tidak memerlukan pelatihan untuk setiap orang, tidak bergantung pada deteksi wajah dan pemotongan, menghasilkan gambar lengkap (bukan hanya wajah atau bibir), dan mempertimbangkan skenario dengan spektrum yang luas (misalnya batang tubuh yang terlihat). atau beragam identitas subjek) yang sangat penting untuk mensintesis manusia yang berkomunikasi dengan benar.

Para penulis menulis.

Kemampuan VLOGGER mencakup dubbing video secara otomatis dalam berbagai bahasa, mengedit video, dan bahkan membuat video lengkap dari satu gambar.

Para peneliti mengklaim VLOGGER mengungguli metode lain dalam kualitas gambar dan realisme. Seiring kemajuan teknologi ini, batas antara video asli dan buatan mungkin kabur. VLOGGER menawarkan gambaran sekilas tentang masa depan AI.

Namun, ada kekhawatiran mengenai potensi penyalahgunaan. Saat VLOGGER menyempurnakan kemampuannya, begitu pula kemudahan dalam membuat deepfake – video yang menggantikan kemiripan seseorang dengan kemiripan lainnya, seperti apa terjadi dengan Taylor Swift.

Anda dapat melihat contohnya di sini.