Google VLOGGER AI ทำให้รูปภาพมีชีวิตชีวาด้วยอวาตาร์พูดได้เหมือนจริง

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน


ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา ไอคอนคำแนะนำเครื่องมือ

อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม

หมายเหตุสำคัญ

  • Google AI สร้างอวตารพูดได้เหมือนจริงจากภาพถ่ายเดี่ยว
  • VLOGGER ใช้โมเดลการแพร่กระจายเพื่อทำให้ภาพถ่ายเคลื่อนไหวได้อย่างสมจริง
  • แอปพลิเคชันที่เป็นไปได้ ได้แก่ อวตาร VR และการพากย์วิดีโอ

นักวิจัยของ Google ได้พัฒนาระบบ AI ใหม่ที่เรียกว่า VLOGGER ซึ่งสามารถสร้างวิดีโอที่สมจริงของผู้คนที่กำลังพูด การแสดงท่าทาง และการเคลื่อนไหว จากภาพนิ่งเพียงภาพเดียว

เทคโนโลยีนี้ ซึ่งอธิบายไว้ในรายงานการวิจัยเรื่อง “VLOGGER: Multimodal Diffusion for Embodied Avatar Sclusion” ใช้ประโยชน์จากโมเดลการแพร่กระจาย ซึ่งเป็นประเภทของการเรียนรู้ของเครื่องที่มีความเป็นเลิศในการสร้างภาพจากคำอธิบายข้อความ ด้วยการใช้เทคโนโลยีนี้กับวิดีโอและฝึกฝนบนชุดข้อมูลขนาดใหญ่ VLOGGER สามารถสร้างภาพเคลื่อนไหวในรูปแบบที่น่าเชื่ออย่างยิ่ง

ตรงกันข้ามกับงานก่อนหน้านี้ วิธีการของเราไม่จำเป็นต้องได้รับการฝึกอบรมสำหรับแต่ละคน ไม่ต้องอาศัยการตรวจจับใบหน้าและการครอบตัด สร้างภาพที่สมบูรณ์ (ไม่ใช่แค่ใบหน้าหรือริมฝีปาก) และพิจารณาสถานการณ์ที่หลากหลาย (เช่น เนื้อตัวที่มองเห็นได้ หรืออัตลักษณ์ที่หลากหลาย) ที่มีความสำคัญต่อการสังเคราะห์มนุษย์ที่สื่อสารได้อย่างถูกต้อง

ผู้เขียนเขียน

ความสามารถของ VLOGGER ประกอบด้วยการพากย์วิดีโอในภาษาต่างๆ โดยอัตโนมัติ การตัดต่อวิดีโอ และแม้แต่การสร้างวิดีโอแบบเต็มจากภาพเดียว

นักวิจัยอ้างว่า VLOGGER มีประสิทธิภาพเหนือกว่าวิธีอื่นๆ ในด้านคุณภาพของภาพและความสมจริง เมื่อเทคโนโลยีนี้ก้าวหน้า เส้นแบ่งระหว่างวิดีโอจริงและวิดีโอเทียมอาจเบลอ VLOGGER นำเสนอภาพรวมเกี่ยวกับอนาคตของ AI

อย่างไรก็ตาม ยังมีความกังวลเกี่ยวกับการใช้งานในทางที่ผิดที่อาจเกิดขึ้น ในขณะที่ VLOGGER ปรับปรุงความสามารถ การสร้าง Deepfakes ก็ทำได้ง่ายเช่นกัน ซึ่งเป็นวิดีโอที่แทนที่ความเหมือนของบุคคลด้วยของของผู้อื่น อย่างเช่นอะไร เกิดขึ้นกับเทย์เลอร์ สวิฟต์

คุณสามารถดูตัวอย่างได้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.