Google VLOGGER AI làm cho những bức ảnh trở nên sống động với hình đại diện biết nói giống như thật

Biểu tượng thời gian đọc 2 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Ghi chú chính

  • Google AI tạo ra hình đại diện biết nói sống động như thật từ những bức ảnh đơn lẻ
  • VLOGGER sử dụng mô hình khuếch tán để tạo ảnh động một cách chân thực.
  • Các ứng dụng tiềm năng bao gồm hình đại diện VR và lồng tiếng video.

Các nhà nghiên cứu của Google đã phát triển một hệ thống AI mới có tên VLOGGER có thể tạo ra các video chân thực về mọi người nói, cử chỉ và di chuyển chỉ từ một bức ảnh tĩnh duy nhất.

Công nghệ này, được mô tả trong một bài nghiên cứu có tiêu đề “VLOGGER: Khuếch tán đa phương thức để tổng hợp hình đại diện được thể hiện”, tận dụng các mô hình khuếch tán, một loại máy học vượt trội trong việc tạo hình ảnh từ mô tả văn bản. Bằng cách áp dụng công nghệ này vào video và huấn luyện nó trên một tập dữ liệu khổng lồ, VLOGGER có thể tạo hoạt ảnh cho các bức ảnh theo cách cực kỳ thuyết phục.

Ngược lại với công việc trước đây, phương pháp của chúng tôi không yêu cầu đào tạo cho từng người, không dựa vào việc nhận diện và cắt xén khuôn mặt, tạo ra hình ảnh hoàn chỉnh (không chỉ khuôn mặt hay đôi môi) và xem xét nhiều tình huống (ví dụ: có thể nhìn thấy thân mình). hoặc danh tính chủ thể đa dạng) rất quan trọng để tổng hợp chính xác những con người giao tiếp.

Các tác giả đã viết.

Các khả năng của VLOGGER bao gồm tự động lồng tiếng cho video bằng các ngôn ngữ khác nhau, chỉnh sửa video và thậm chí tạo video đầy đủ từ một hình ảnh duy nhất.

Các nhà nghiên cứu khẳng định VLOGGER vượt trội hơn các phương pháp khác về chất lượng hình ảnh và độ chân thực. Khi công nghệ này tiến bộ, ranh giới giữa video thật và video nhân tạo có thể bị mờ đi. VLOGGER mang đến cái nhìn thoáng qua về tương lai của AI.

Tuy nhiên, vẫn tồn tại những lo ngại về khả năng lạm dụng. Khi VLOGGER cải tiến các khả năng của mình, thì việc tạo các tác phẩm giả mạo sâu cũng trở nên dễ dàng hơn – các video thay thế hình ảnh của một người bằng hình ảnh của người khác, chẳng hạn như những gì đã xảy ra với Taylor Swift.

Bạn có thể xem các ví dụ tại đây.