Google VLOGGER AI dă viață fotografiilor cu avatare care vorbesc realiste

Pictograma timp de citire 2 min. citit


Cititorii ajută la sprijinirea MSpoweruser. Este posibil să primim un comision dacă cumpărați prin link-urile noastre. Pictograma Tooltip

Citiți pagina noastră de dezvăluire pentru a afla cum puteți ajuta MSPoweruser să susțină echipa editorială Află mai multe

Note cheie

  • Google AI creează avataruri reale care vorbesc din fotografii individuale.
  • VLOGGER folosește modele de difuzie pentru a anima fotografii în mod realist.
  • Aplicațiile potențiale includ avatare VR și dublare video.

Cercetătorii Google au dezvoltat un nou sistem AI numit VLOGGER care poate genera videoclipuri realiste cu oameni care vorbesc, fac gesturi și se mișcă. dintr-o singură fotografie statică.

Această tehnologie, descrisă într-o lucrare de cercetare intitulată „VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis”, folosește modele de difuzie, un tip de învățare automată care excelează la crearea de imagini din descrieri de text. Aplicând această tehnologie în videoclipuri și antrenându-l pe un set de date masiv, VLOGGER poate anima fotografii într-un mod extrem de convingător.

Spre deosebire de lucrările anterioare, metoda noastră nu necesită pregătire pentru fiecare persoană, nu se bazează pe detectarea și decuparea feței, generează imaginea completă (nu doar fața sau buzele) și ia în considerare un spectru larg de scenarii (de exemplu, trunchiul vizibil). sau identități de subiecte diverse) care sunt esențiale pentru a sintetiza corect oamenii care comunică.

Au scris autorii.

Capacitățile VLOGGER includ dublarea automată a videoclipurilor în diferite limbi, editarea videoclipurilor și chiar crearea de videoclipuri complete dintr-o singură imagine.

Cercetătorii susțin că VLOGGER depășește alte metode în ceea ce privește calitatea și realismul imaginii. Pe măsură ce această tehnologie avansează, linia dintre videoclipurile reale și cele artificiale se poate estompa. VLOGGER oferă o privire asupra viitorului AI.

Cu toate acestea, există îngrijorări cu privire la potențiala utilizare greșită. Pe măsură ce VLOGGER își perfecționează abilitățile, la fel și ușurința de a crea deepfake - videoclipuri care înlocuiesc asemănarea unei persoane cu cea a altei, cum ar fi ceea ce sa întâmplat cu Taylor Swift.

Puteți vizualiza exemplele aici.

Lasă un comentariu

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate *