Google VLOGGER AI erweckt Fotos mit lebensechten sprechenden Avataren zum Leben

Symbol für die Lesezeit 2 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Lesen Sie weiter

Wichtige Hinweise

  • Google AI erstellt aus einzelnen Fotos lebensechte sprechende Avatare.
  • VLOGGER verwendet Diffusionsmodelle, um Fotos realistisch zu animieren.
  • Zu den möglichen Anwendungen gehören VR-Avatare und die Videosynchronisierung.

Google-Forscher haben ein neues KI-System namens VLOGGER entwickelt, das realistische Videos von sprechenden, gestikulierenden und sich bewegenden Menschen erstellen kann aus nur einem einzigen Standbild.

Diese Technologie, die in einem Forschungspapier mit dem Titel „VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis“ beschrieben wird, nutzt Diffusionsmodelle, eine Art maschinelles Lernen, die sich hervorragend für die Erstellung von Bildern aus Textbeschreibungen eignet. Durch die Anwendung dieser Technologie auf Videos und das Training anhand eines riesigen Datensatzes kann VLOGGER Fotos auf eine äußerst überzeugende Weise animieren.

Im Gegensatz zu früheren Arbeiten erfordert unsere Methode kein Training für jede Person, ist nicht auf Gesichtserkennung und -zuschnitt angewiesen, generiert das vollständige Bild (nicht nur das Gesicht oder die Lippen) und berücksichtigt ein breites Spektrum an Szenarien (z. B. sichtbarer Oberkörper). oder unterschiedliche Subjektidentitäten), die für die korrekte Synthese kommunizierender Menschen von entscheidender Bedeutung sind.

Die Autoren haben geschrieben.

Zu den Funktionen von VLOGGER gehören das automatische Überspielen von Videos in verschiedene Sprachen, das Bearbeiten von Videos und sogar das Erstellen vollständiger Videos aus einem einzelnen Bild.

Forscher behaupten, dass VLOGGER andere Methoden in Bezug auf Bildqualität und Realismus übertrifft. Mit der Weiterentwicklung dieser Technologie verschwimmt möglicherweise die Grenze zwischen echten und künstlichen Videos. VLOGGER bietet einen Einblick in die Zukunft der KI.

Es bestehen jedoch Bedenken hinsichtlich eines möglichen Missbrauchs. Während VLOGGER seine Fähigkeiten verfeinert, wird es auch einfacher, Deepfakes zu erstellen – Videos, die das Abbild einer Person durch das einer anderen ersetzen, etwa was passierte mit Taylor Swift.

Sie können sich die Beispiele ansehen hier.