Google VLOGGER AI ทำให้รูปภาพมีชีวิตชีวาด้วยอวาตาร์พูดได้เหมือนจริง
2 นาที. อ่าน
เผยแพร่เมื่อ
อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม
หมายเหตุสำคัญ
- Google AI สร้างอวตารพูดได้เหมือนจริงจากภาพถ่ายเดี่ยว
- VLOGGER ใช้โมเดลการแพร่กระจายเพื่อทำให้ภาพถ่ายเคลื่อนไหวได้อย่างสมจริง
- แอปพลิเคชันที่เป็นไปได้ ได้แก่ อวตาร VR และการพากย์วิดีโอ
นักวิจัยของ Google ได้พัฒนาระบบ AI ใหม่ที่เรียกว่า VLOGGER ซึ่งสามารถสร้างวิดีโอที่สมจริงของผู้คนที่กำลังพูด การแสดงท่าทาง และการเคลื่อนไหว จากภาพนิ่งเพียงภาพเดียว
เทคโนโลยีนี้ ซึ่งอธิบายไว้ในรายงานการวิจัยเรื่อง “VLOGGER: Multimodal Diffusion for Embodied Avatar Sclusion” ใช้ประโยชน์จากโมเดลการแพร่กระจาย ซึ่งเป็นประเภทของการเรียนรู้ของเครื่องที่มีความเป็นเลิศในการสร้างภาพจากคำอธิบายข้อความ ด้วยการใช้เทคโนโลยีนี้กับวิดีโอและฝึกฝนบนชุดข้อมูลขนาดใหญ่ VLOGGER สามารถสร้างภาพเคลื่อนไหวในรูปแบบที่น่าเชื่ออย่างยิ่ง
ตรงกันข้ามกับงานก่อนหน้านี้ วิธีการของเราไม่จำเป็นต้องได้รับการฝึกอบรมสำหรับแต่ละคน ไม่ต้องอาศัยการตรวจจับใบหน้าและการครอบตัด สร้างภาพที่สมบูรณ์ (ไม่ใช่แค่ใบหน้าหรือริมฝีปาก) และพิจารณาสถานการณ์ที่หลากหลาย (เช่น เนื้อตัวที่มองเห็นได้ หรืออัตลักษณ์ที่หลากหลาย) ที่มีความสำคัญต่อการสังเคราะห์มนุษย์ที่สื่อสารได้อย่างถูกต้อง
ผู้เขียนเขียน
ความสามารถของ VLOGGER ประกอบด้วยการพากย์วิดีโอในภาษาต่างๆ โดยอัตโนมัติ การตัดต่อวิดีโอ และแม้แต่การสร้างวิดีโอแบบเต็มจากภาพเดียว
นักวิจัยอ้างว่า VLOGGER มีประสิทธิภาพเหนือกว่าวิธีอื่นๆ ในด้านคุณภาพของภาพและความสมจริง เมื่อเทคโนโลยีนี้ก้าวหน้า เส้นแบ่งระหว่างวิดีโอจริงและวิดีโอเทียมอาจเบลอ VLOGGER นำเสนอภาพรวมเกี่ยวกับอนาคตของ AI
อย่างไรก็ตาม ยังมีความกังวลเกี่ยวกับการใช้งานในทางที่ผิดที่อาจเกิดขึ้น ในขณะที่ VLOGGER ปรับปรุงความสามารถ การสร้าง Deepfakes ก็ทำได้ง่ายเช่นกัน ซึ่งเป็นวิดีโอที่แทนที่ความเหมือนของบุคคลด้วยของของผู้อื่น อย่างเช่นอะไร เกิดขึ้นกับเทย์เลอร์ สวิฟต์
คุณสามารถดูตัวอย่างได้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.