Google VLOGGER AI ทำให้รูปภาพมีชีวิตชีวาด้วยอวาตาร์พูดได้เหมือนจริง

หน้าแรก » ข่าว

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน

ไอคอนปฏิทิน เผยแพร่เมื่อ March 18, 2024

by เดวิช เบรี

เผยแพร่บน March 18, 2024

ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา

หมายเหตุสำคัญ

Google AI สร้างอวตารพูดได้เหมือนจริงจากภาพถ่ายเดี่ยว
VLOGGER ใช้โมเดลการแพร่กระจายเพื่อทำให้ภาพถ่ายเคลื่อนไหวได้อย่างสมจริง
แอปพลิเคชันที่เป็นไปได้ ได้แก่ อวตาร VR และการพากย์วิดีโอ

นักวิจัยของ Google ได้พัฒนาระบบ AI ใหม่ที่เรียกว่า VLOGGER ซึ่งสามารถสร้างวิดีโอที่สมจริงของผู้คนที่กำลังพูด การแสดงท่าทาง และการเคลื่อนไหว จากภาพนิ่งเพียงภาพเดียว

เทคโนโลยีนี้ ซึ่งอธิบายไว้ในรายงานการวิจัยเรื่อง “VLOGGER: Multimodal Diffusion for Embodied Avatar Sclusion” ใช้ประโยชน์จากโมเดลการแพร่กระจาย ซึ่งเป็นประเภทของการเรียนรู้ของเครื่องที่มีความเป็นเลิศในการสร้างภาพจากคำอธิบายข้อความ ด้วยการใช้เทคโนโลยีนี้กับวิดีโอและฝึกฝนบนชุดข้อมูลขนาดใหญ่ VLOGGER สามารถสร้างภาพเคลื่อนไหวในรูปแบบที่น่าเชื่ออย่างยิ่ง

ตรงกันข้ามกับงานก่อนหน้านี้ วิธีการของเราไม่จำเป็นต้องได้รับการฝึกอบรมสำหรับแต่ละคน ไม่ต้องอาศัยการตรวจจับใบหน้าและการครอบตัด สร้างภาพที่สมบูรณ์ (ไม่ใช่แค่ใบหน้าหรือริมฝีปาก) และพิจารณาสถานการณ์ที่หลากหลาย (เช่น เนื้อตัวที่มองเห็นได้ หรืออัตลักษณ์ที่หลากหลาย) ที่มีความสำคัญต่อการสังเคราะห์มนุษย์ที่สื่อสารได้อย่างถูกต้อง

ผู้เขียนเขียน

ความสามารถของ VLOGGER ประกอบด้วยการพากย์วิดีโอในภาษาต่างๆ โดยอัตโนมัติ การตัดต่อวิดีโอ และแม้แต่การสร้างวิดีโอแบบเต็มจากภาพเดียว

นักวิจัยอ้างว่า VLOGGER มีประสิทธิภาพเหนือกว่าวิธีอื่นๆ ในด้านคุณภาพของภาพและความสมจริง เมื่อเทคโนโลยีนี้ก้าวหน้า เส้นแบ่งระหว่างวิดีโอจริงและวิดีโอเทียมอาจเบลอ VLOGGER นำเสนอภาพรวมเกี่ยวกับอนาคตของ AI

อย่างไรก็ตาม ยังมีความกังวลเกี่ยวกับการใช้งานในทางที่ผิดที่อาจเกิดขึ้น ในขณะที่ VLOGGER ปรับปรุงความสามารถ การสร้าง Deepfakes ก็ทำได้ง่ายเช่นกัน ซึ่งเป็นวิดีโอที่แทนที่ความเหมือนของบุคคลด้วยของของผู้อื่น อย่างเช่นอะไร เกิดขึ้นกับเทย์เลอร์ สวิฟต์

คุณสามารถดูตัวอย่างได้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

เดวิช เบรี

นักข่าวเทคโนโลยี

สิ่งเหล่านี้คือสิ่งที่กระตุ้นให้ฉัน - การสร้างเนื้อหาที่ให้ข้อมูลและเป็นประโยชน์ ไล่ตามความหลงใหลในกีฬามอเตอร์สปอร์ตและดนตรี มีส่วนร่วมในการเดินทาง รักษาวิถีชีวิตที่มีสุขภาพดี และใช้เวลากับทาโก้แมวแสนน่ารักของฉัน