Google VLOGGER AI, gerçekçi konuşan avatarlarla fotoğraflara hayat veriyor

Okuma zamanı simgesi 2 dk. okuman


Okuyucular MSpoweruser'ı desteklemeye yardımcı olur. Bağlantılarımız aracılığıyla satın alırsanız komisyon alabiliriz. Araç İpucu Simgesi

MSPoweruser'ın editör ekibini ayakta tutmasına nasıl yardımcı olabileceğinizi öğrenmek için açıklama sayfamızı okuyun. Daha fazla

Önemli notlar

  • Google AI, tek fotoğraflardan gerçeğe yakın konuşan avatarlar oluşturur.
  • VLOGGER, fotoğrafları gerçekçi bir şekilde canlandırmak için yayılma modellerini kullanır.
  • Potansiyel uygulamalar arasında VR avatarları ve video dublajı yer alıyor.

Google araştırmacıları, konuşan, jest yapan ve hareket eden insanların gerçekçi videolarını oluşturabilen, VLOGGER adında yeni bir yapay zeka sistemi geliştirdi. sadece tek bir fotoğraftan.

“VLOGGER: Somutlaştırılmış Avatar Sentezi için Multimodal Difüzyon” başlıklı bir araştırma makalesinde açıklanan bu teknoloji, metin açıklamalarından görseller oluşturmada üstün olan bir tür makine öğrenimi olan difüzyon modellerinden yararlanıyor. VLOGGER, bu teknolojiyi videoya uygulayarak ve onu devasa bir veri kümesi üzerinde eğiterek, fotoğrafları oldukça ikna edici bir şekilde canlandırabilir.

Önceki çalışmaların aksine, yöntemimiz her kişi için eğitim gerektirmez, yüz algılama ve kırpmaya dayanmaz, tam görüntüyü oluşturur (yalnızca yüz veya dudaklar değil) ve geniş bir senaryo yelpazesini (örneğin görünür gövde) dikkate alır. veya farklı özne kimlikleri) iletişim kuran insanları doğru bir şekilde sentezlemek için kritik öneme sahiptir.

Yazarlar yazdı.

VLOGGER'ın yetenekleri arasında videoların farklı dillerde otomatik olarak çoğaltılması, videoların düzenlenmesi ve hatta tek bir görüntüden tam videolar oluşturulması yer alır.

Araştırmacılar, VLOGGER'ın görüntü kalitesi ve gerçekçilik açısından diğer yöntemlerden daha iyi performans gösterdiğini iddia ediyor. Bu teknoloji ilerledikçe gerçek ve yapay videolar arasındaki çizgi bulanıklaşabilir. VLOGGER yapay zekanın geleceğine bir bakış sunuyor.

Ancak potansiyel kötüye kullanıma ilişkin endişeler mevcuttur. VLOGGER yeteneklerini geliştirdikçe, derin sahte videolar (bir kişinin benzerliğini bir başkasınınkiyle değiştiren videolar) oluşturmanın kolaylığı da artıyor. Taylor Swift'le oldu.

Örnekleri inceleyebilirsiniz okuyun.

Kullanıcı forumu

0 mesajları