Google VLOGGER AI는 실제처럼 말하는 아바타로 사진에 생기를 불어넣습니다.

독서 시간 아이콘 2 분. 읽다


독자들은 MSpoweruser를 지원하는 데 도움을 줍니다. 당사의 링크를 통해 구매하시면 수수료를 받을 수 있습니다. 툴팁 아이콘

공개 페이지를 읽고 MSPoweruser가 편집팀을 유지하는 데 어떻게 도움을 줄 수 있는지 알아보세요. 자세히 보기

주요 사항

  • Google AI는 한 장의 사진으로 실제와 같은 말하는 아바타를 만듭니다.
  • VLOGGER는 확산 모델을 사용하여 사진을 사실적으로 애니메이션화합니다.
  • 잠재적인 응용 분야에는 VR 아바타와 비디오 더빙이 포함됩니다.

Google 연구원들은 사람들이 말하고, 몸짓을 하고, 움직이는 모습을 실감나는 영상으로 생성할 수 있는 VLOGGER라는 새로운 AI 시스템을 개발했습니다. 단 하나의 정지 사진에서.

"VLOGGER: 구체화된 아바타 합성을 위한 다중 모드 확산"이라는 연구 논문에 설명된 이 기술은 텍스트 설명에서 이미지를 생성하는 데 탁월한 기계 학습 유형인 확산 모델을 활용합니다. VLOGGER는 이 기술을 비디오에 적용하고 이를 대규모 데이터 세트에서 교육함으로써 매우 설득력 있는 방식으로 사진에 애니메이션을 적용할 수 있습니다.

이전 작업과 달리 우리의 방법은 각 사람에 대한 훈련이 필요하지 않고 얼굴 감지 및 자르기에 의존하지 않으며 완전한 이미지(얼굴이나 입술뿐만 아니라)를 생성하고 광범위한 시나리오(예: 눈에 보이는 몸통)를 고려합니다. 또는 다양한 주체 정체성)은 의사소통하는 인간을 올바르게 종합하는 데 중요합니다.

저자는 썼습니다.

VLOGGER의 기능에는 다양한 언어로 비디오를 자동으로 더빙하고, 비디오를 편집하고, 단일 이미지에서 전체 비디오를 만드는 것까지 포함됩니다.

연구원들은 VLOGGER가 이미지 품질과 사실성 측면에서 다른 방법보다 뛰어나다고 주장합니다. 이 기술이 발전함에 따라 실제 영상과 인공 영상의 경계가 모호해질 수 있습니다. VLOGGER에서는 AI의 미래를 엿볼 수 있습니다.

그러나 잠재적인 오용에 대한 우려도 있습니다. VLOGGER의 능력이 향상됨에 따라 딥페이크(사람의 모습을 다른 사람의 모습으로 대체하는 동영상) 제작의 용이성도 향상됩니다. Taylor Swift와 함께 일어났습니다.

예시를 보실 수 있습니다 여기에서 지금 확인해 보세요..

댓글을 남겨주세요.

귀하의 이메일 주소는 공개되지 않습니다. *표시항목은 꼭 기재해 주세요. *