Google VLOGGER AI는 실제처럼 말하는 아바타로 사진에 생기를 불어넣습니다.

Home » 뉴스

2 분. 읽다

에 업데이트 됨 2024 년 7 월 22 일

by 데베쉬베리

업데이트 2024 년 7 월 22 일

이 기사 공유

이 가이드를 개선하세요

독자들은 MSpoweruser를 지원하는 데 도움을 줍니다. 당사의 링크를 통해 구매하시면 수수료를 받을 수 있습니다.

주요 사항

Google AI는 한 장의 사진으로 실제와 같은 말하는 아바타를 만듭니다.
VLOGGER는 확산 모델을 사용하여 사진을 사실적으로 애니메이션화합니다.
잠재적인 응용 분야에는 VR 아바타와 비디오 더빙이 포함됩니다.

Google 연구원들은 사람들이 말하고, 몸짓을 하고, 움직이는 모습을 실감나는 영상으로 생성할 수 있는 VLOGGER라는 새로운 AI 시스템을 개발했습니다. 단 하나의 정지 사진에서.

"VLOGGER: 구체화된 아바타 합성을 위한 다중 모드 확산"이라는 연구 논문에 설명된 이 기술은 텍스트 설명에서 이미지를 생성하는 데 탁월한 기계 학습 유형인 확산 모델을 활용합니다. VLOGGER는 이 기술을 비디오에 적용하고 이를 대규모 데이터 세트에서 교육함으로써 매우 설득력 있는 방식으로 사진에 애니메이션을 적용할 수 있습니다.

이전 작업과 달리 우리의 방법은 각 사람에 대한 훈련이 필요하지 않고 얼굴 감지 및 자르기에 의존하지 않으며 완전한 이미지(얼굴이나 입술뿐만 아니라)를 생성하고 광범위한 시나리오(예: 눈에 보이는 몸통)를 고려합니다. 또는 다양한 주체 정체성)은 의사소통하는 인간을 올바르게 종합하는 데 중요합니다.

저자는 썼습니다.