Google VLOGGER AI gir liv til bilder med naturtro snakkende avatarer

Ikon for lesetid 2 min. lese


Lesere hjelper til med å støtte MSpoweruser. Vi kan få provisjon hvis du kjøper gjennom lenkene våre. Verktøytipsikon

Les vår avsløringsside for å finne ut hvordan du kan hjelpe MSPoweruser opprettholde redaksjonen Les mer

Viktige merknader

  • Google AI lager naturtro snakkende avatarer fra enkeltbilder.
  • VLOGGER bruker diffusjonsmodeller for å animere bilder realistisk.
  • Potensielle applikasjoner inkluderer VR-avatarer og videodubbing.

Google-forskere har utviklet et nytt AI-system kalt VLOGGER som kan generere realistiske videoer av folk som snakker, gestikulerer og beveger seg fra bare ett enkelt stillbilde.

Denne teknologien, beskrevet i en forskningsartikkel med tittelen "VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis," utnytter diffusjonsmodeller, en type maskinlæring som utmerker seg ved å lage bilder fra tekstbeskrivelser. Ved å bruke denne teknologien på video og trene den på et massivt datasett, kan VLOGGER animere bilder på en måte som er svært overbevisende.

I motsetning til tidligere arbeid, krever ikke metoden vår trening for hver person, er ikke avhengig av ansiktsgjenkjenning og beskjæring, genererer hele bildet (ikke bare ansiktet eller leppene), og vurderer et bredt spekter av scenarier (f.eks. synlig torso) eller ulike fagidentiteter) som er avgjørende for å syntetisere mennesker som kommuniserer på riktig måte.

Forfatterne skrev.

VLOGGERs muligheter inkluderer automatisk dubbing av videoer på forskjellige språk, redigering av videoer og til og med å lage hele videoer fra ett enkelt bilde.

Forskere hevder VLOGGER utkonkurrerer andre metoder når det gjelder bildekvalitet og realisme. Etter hvert som denne teknologien utvikler seg, kan grensen mellom ekte og kunstige videoer viskes ut. VLOGGER gir et glimt inn i fremtiden til AI.

Imidlertid er det bekymring for mulig misbruk. Ettersom VLOGGER foredler sine evner, blir det også enklere å lage dype faker – videoer som erstatter en persons likhet med en annens, som hva skjedde med Taylor Swift.

Du kan se eksemplene her..