Google VLOGGER AI bringer billeder til live med livagtige talende avatarer

Ikon for læsetid 2 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

Nøgle noter

  • Google AI skaber livagtige talende avatarer ud fra enkelte billeder.
  • VLOGGER bruger diffusionsmodeller til at animere billeder realistisk.
  • Potentielle applikationer omfatter VR-avatarer og videodubbing.

Google-forskere har udviklet et nyt AI-system kaldet VLOGGER, der kan generere realistiske videoer af mennesker, der taler, gestikulerer og bevæger sig fra kun et enkelt stillbillede.

Denne teknologi, beskrevet i en forskningsartikel med titlen "VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis," udnytter diffusionsmodeller, en type maskinlæring, der udmærker sig ved at skabe billeder ud fra tekstbeskrivelser. Ved at anvende denne teknologi til video og træne den på et massivt datasæt, kan VLOGGER animere billeder på en måde, der er yderst overbevisende.

I modsætning til tidligere arbejde kræver vores metode ikke træning af hver person, den er ikke afhængig af ansigtsgenkendelse og beskæring, genererer det komplette billede (ikke kun ansigtet eller læberne) og tager højde for et bredt spektrum af scenarier (f.eks. synlig torso eller forskellige emneidentiteter), der er afgørende for korrekt at syntetisere mennesker, der kommunikerer.

Forfatterne skrev.

VLOGGERs muligheder inkluderer automatisk dubbing af videoer på forskellige sprog, redigering af videoer og endda oprettelse af hele videoer fra et enkelt billede.

Forskere hævder, at VLOGGER udkonkurrerer andre metoder i billedkvalitet og realisme. Efterhånden som denne teknologi udvikler sig, kan grænsen mellem ægte og kunstige videoer udviskes. VLOGGER giver et indblik i fremtiden for kunstig intelligens.

Der er dog bekymringer vedrørende potentielt misbrug. Efterhånden som VLOGGER forfiner sine evner, gør det også nemt at skabe deepfakes – videoer, der erstatter en persons lighed med en andens, som f.eks. skete med Taylor Swift.

Du kan se eksemplerne link..