Google VLOGGER AI ożywia zdjęcia za pomocą realistycznych, mówiących awatarów
2 minuta. czytać
Opublikowany
Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej
Kluczowe uwagi
- Google AI tworzy realistyczne, mówiące awatary z pojedynczych zdjęć.
- VLOGGER wykorzystuje modele dyfuzyjne do realistycznej animacji zdjęć.
- Potencjalne zastosowania obejmują awatary VR i dubbing wideo.
Badacze Google opracowali nowy system sztucznej inteligencji o nazwie VLOGGER, który może generować realistyczne filmy przedstawiające ludzi mówiących, gestykulujących i poruszających się z jednego zdjęcia.
Technologia ta, opisana w artykule badawczym zatytułowanym „VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis”, wykorzystuje modele dyfuzji, czyli rodzaj uczenia maszynowego, który doskonale sprawdza się w tworzeniu obrazów na podstawie opisów tekstowych. Stosując tę technologię w przypadku wideo i trenując ją na ogromnym zbiorze danych, VLOGGER może animować zdjęcia w bardzo przekonujący sposób.
W przeciwieństwie do poprzednich prac, nasza metoda nie wymaga szkolenia każdej osoby, nie polega na wykrywaniu i kadrowaniu twarzy, generuje pełny obraz (nie tylko twarzy czy ust) i uwzględnia szerokie spektrum scenariuszy (np. widoczny tułów lub różnorodne tożsamości podmiotowe), które są niezbędne do prawidłowej syntezy ludzi, którzy się komunikują.
Autorzy napisali.
Możliwości VLOGGERa obejmują automatyczne kopiowanie filmów w różnych językach, edycję filmów, a nawet tworzenie pełnych filmów z jednego obrazu.
Naukowcy twierdzą, że VLOGGER przewyższa inne metody pod względem jakości obrazu i realizmu. W miarę rozwoju tej technologii granica między prawdziwymi i sztucznymi filmami może się zatrzeć. VLOGGER oferuje wgląd w przyszłość sztucznej inteligencji.
Istnieją jednak obawy dotyczące potencjalnego niewłaściwego użycia. W miarę udoskonalania swoich możliwości VLOGGER zwiększa także łatwość tworzenia deepfake’ów – filmów, które zastępują czyjąś podobiznę inną, np. stało się z Taylor Swift.
Możesz zobaczyć przykłady tutaj.