Google VLOGGER AI oživi fotografije z realističnimi govorečimi avatarji

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

Ključne opombe

  • Google AI ustvari realistične govoreče avatarje iz posameznih fotografij.
  • VLOGGER uporablja difuzijske modele za realistično animiranje fotografij.
  • Možne aplikacije vključujejo VR avatarje in video sinhronizacijo.

Googlovi raziskovalci so razvili nov sistem umetne inteligence, imenovan VLOGGER, ki lahko ustvari realistične videoposnetke ljudi, ki govorijo, gestikulirajo in se premikajo. iz samo ene fotografije.

Ta tehnologija, opisana v raziskovalnem dokumentu z naslovom »VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis«, izkorišča difuzijske modele, vrsto strojnega učenja, ki je odličen pri ustvarjanju slik iz besedilnih opisov. Z uporabo te tehnologije za videoposnetke in urjenjem na ogromnem naboru podatkov lahko VLOGGER animira fotografije na zelo prepričljiv način.

V nasprotju s prejšnjim delom naša metoda ne zahteva usposabljanja za vsako osebo, se ne zanaša na zaznavanje in obrezovanje obraza, ustvari celotno sliko (ne samo obraza ali ustnic) in upošteva širok spekter scenarijev (npr. vidni trup ali različne identitete subjektov), ​​ki so ključnega pomena za pravilno sintezo ljudi, ki komunicirajo.

Avtorji so zapisali.

Zmogljivosti VLOGGERja vključujejo samodejno presnemavanje videoposnetkov v različnih jezikih, urejanje videoposnetkov in celo ustvarjanje celotnih videoposnetkov iz ene same slike.

Raziskovalci trdijo, da VLOGGER prekaša druge metode glede kakovosti in realizma slike. Z napredkom te tehnologije se lahko meja med resničnimi in umetnimi videoposnetki zabriše. VLOGGER ponuja vpogled v prihodnost umetne inteligence.

Vendar obstajajo pomisleki glede morebitne zlorabe. Ko VLOGGER izpopolnjuje svoje zmožnosti, se povečuje tudi enostavnost ustvarjanja globokih ponaredkov – videoposnetkov, ki zamenjajo podobo osebe z drugo, na primer zgodilo s Taylor Swift.

Lahko si ogledate primere tukaj.

Pustite Odgovori

Vaš e-naslov ne bo objavljen. Obvezna polja so označena *