Google VLOGGER AI ożywia zdjęcia za pomocą realistycznych, mówiących awatarów

Ikona czasu czytania 2 minuta. czytać


Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków. Ikona podpowiedzi

Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej

Kluczowe uwagi

  • Google AI tworzy realistyczne, mówiące awatary z pojedynczych zdjęć.
  • VLOGGER wykorzystuje modele dyfuzyjne do realistycznej animacji zdjęć.
  • Potencjalne zastosowania obejmują awatary VR i dubbing wideo.

Badacze Google opracowali nowy system sztucznej inteligencji o nazwie VLOGGER, który może generować realistyczne filmy przedstawiające ludzi mówiących, gestykulujących i poruszających się z jednego zdjęcia.

Technologia ta, opisana w artykule badawczym zatytułowanym „VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis”, wykorzystuje modele dyfuzji, czyli rodzaj uczenia maszynowego, który doskonale sprawdza się w tworzeniu obrazów na podstawie opisów tekstowych. Stosując tę ​​technologię w przypadku wideo i trenując ją na ogromnym zbiorze danych, VLOGGER może animować zdjęcia w bardzo przekonujący sposób.

W przeciwieństwie do poprzednich prac, nasza metoda nie wymaga szkolenia każdej osoby, nie polega na wykrywaniu i kadrowaniu twarzy, generuje pełny obraz (nie tylko twarzy czy ust) i uwzględnia szerokie spektrum scenariuszy (np. widoczny tułów lub różnorodne tożsamości podmiotowe), które są niezbędne do prawidłowej syntezy ludzi, którzy się komunikują.

Autorzy napisali.

Możliwości VLOGGERa obejmują automatyczne kopiowanie filmów w różnych językach, edycję filmów, a nawet tworzenie pełnych filmów z jednego obrazu.

Naukowcy twierdzą, że VLOGGER przewyższa inne metody pod względem jakości obrazu i realizmu. W miarę rozwoju tej technologii granica między prawdziwymi i sztucznymi filmami może się zatrzeć. VLOGGER oferuje wgląd w przyszłość sztucznej inteligencji.

Istnieją jednak obawy dotyczące potencjalnego niewłaściwego użycia. W miarę udoskonalania swoich możliwości VLOGGER zwiększa także łatwość tworzenia deepfake’ów – filmów, które zastępują czyjąś podobiznę inną, np. stało się z Taylor Swift.

Możesz zobaczyć przykłady tutaj.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *