Google VLOGGER AI brengt foto's tot leven met levensechte pratende avatars

Pictogram voor leestijd 2 minuut. lezen


Lezers helpen MSpoweruser ondersteunen. We kunnen een commissie krijgen als u via onze links koopt. Tooltip-pictogram

Lees onze openbaarmakingspagina om erachter te komen hoe u MSPoweruser kunt helpen het redactieteam te ondersteunen Lees meer

Belangrijkste opmerkingen

  • Google AI maakt levensechte sprekende avatars van afzonderlijke foto's.
  • VLOGGER gebruikt diffusiemodellen om foto's realistisch te animeren.
  • Mogelijke toepassingen zijn onder meer VR-avatars en video-nasynchronisatie.

Google-onderzoekers hebben een nieuw AI-systeem ontwikkeld, VLOGGER genaamd, dat realistische video's kan genereren van mensen die spreken, gebaren maken en bewegen van slechts één enkele foto.

Deze technologie, beschreven in een onderzoekspaper met de titel “VLOGGER: Multimodal Diffusion for Embody Avatar Synthesis”, maakt gebruik van diffusiemodellen, een vorm van machinaal leren die uitblinkt in het creëren van afbeeldingen uit tekstbeschrijvingen. Door deze technologie toe te passen op video en deze te trainen op een enorme dataset, kan VLOGGER foto's animeren op een manier die zeer overtuigend is.

In tegenstelling tot eerder werk vereist onze methode geen training voor elke persoon, is niet afhankelijk van gezichtsdetectie en bijsnijden, genereert het het volledige beeld (niet alleen het gezicht of de lippen) en houdt het rekening met een breed spectrum aan scenario's (bijv. zichtbare torso of diverse subjectidentiteiten) die van cruciaal belang zijn voor het correct synthetiseren van mensen die communiceren.

De auteurs schreven.

De mogelijkheden van VLOGGER omvatten het automatisch nasynchroniseren van video's in verschillende talen, het bewerken van video's en zelfs het maken van volledige video's van één enkele afbeelding.

Onderzoekers beweren dat VLOGGER beter presteert dan andere methoden wat betreft beeldkwaliteit en realisme. Naarmate deze technologie zich verder ontwikkelt, kan de grens tussen echte en kunstmatige video’s vervagen. VLOGGER biedt een kijkje in de toekomst van AI.

Er bestaan ​​echter zorgen over mogelijk misbruik. Naarmate VLOGGER zijn mogelijkheden verfijnt, neemt ook het gemak van het maken van deepfakes toe: video's die de gelijkenis van een persoon vervangen door die van een ander, zoals wat gebeurde met Taylor Swift.

U kunt de voorbeelden bekijken hier.

Laat een reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd *