L'intelligenza artificiale di Google VLOGGER dà vita alle foto con avatar parlanti realistici

Icona del tempo di lettura 2 minuto. leggere


I lettori aiutano a supportare MSpoweruser. Potremmo ricevere una commissione se acquisti tramite i nostri link. Icona descrizione comando

Leggi la nostra pagina informativa per scoprire come puoi aiutare MSPoweruser a sostenere il team editoriale Per saperne di più

Note chiave

  • L'intelligenza artificiale di Google crea avatar parlanti realistici da singole foto.
  • VLOGGER utilizza modelli di diffusione per animare le foto in modo realistico.
  • Le potenziali applicazioni includono avatar VR e doppiaggio video.

I ricercatori di Google hanno sviluppato un nuovo sistema di intelligenza artificiale chiamato VLOGGER in grado di generare video realistici di persone che parlano, gesticolano e si muovono da una sola foto.

Questa tecnologia, descritta in un documento di ricerca intitolato “VLOGGER: Multimodal Diffusion for Embody Avatar Synthesis”, sfrutta i modelli di diffusione, un tipo di apprendimento automatico che eccelle nella creazione di immagini da descrizioni di testo. Applicando questa tecnologia ai video e addestrandoli su un enorme set di dati, VLOGGER può animare le foto in un modo molto convincente.

A differenza del lavoro precedente, il nostro metodo non richiede formazione per ogni persona, non si basa sul rilevamento e sul ritaglio del volto, genera l'immagine completa (non solo il viso o le labbra) e considera un ampio spettro di scenari (ad esempio torso visibile o identità soggettive diverse) che sono fondamentali per sintetizzare correttamente gli esseri umani che comunicano.

Gli autori hanno scritto.

Le funzionalità di VLOGGER includono il doppiaggio automatico di video in diverse lingue, la modifica di video e persino la creazione di video completi da una singola immagine.

I ricercatori affermano che VLOGGER supera gli altri metodi in termini di qualità e realismo dell'immagine. Con l’avanzare di questa tecnologia, il confine tra video reali e artificiali potrebbe sfumare. VLOGGER offre uno sguardo al futuro dell'intelligenza artificiale.

Tuttavia, esistono preoccupazioni riguardo al potenziale uso improprio. Man mano che VLOGGER affina le sue capacità, aumenta anche la facilità di creare deepfake: video che sostituiscono le sembianze di una persona con quelle di un'altra, come quello è successo con Taylor Swift.

È possibile visualizzare gli esempi qui.

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *