Microsoft อวดความก้าวหน้าในเทคโนโลยีการแปลคำพูด

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน


ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา ไอคอนคำแนะนำเครื่องมือ

อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม

Rick Rashid หัวหน้าเจ้าหน้าที่วิจัยของ Microsoft สาธิตในเมืองเทียนจิน ประเทศจีน ที่งาน Microsoft Research Asia's 21st Century Computing เขาพูดคุยเกี่ยวกับการรู้จำเสียงในการประมวลผลและความก้าวหน้าล่าสุดที่ Microsoft มีอยู่ในนั้น

จนกระทั่งเมื่อเร็วๆ นี้ แม้แต่ระบบคำพูดที่ดีที่สุดยังคงมีอัตราความผิดพลาดของคำอยู่ที่ 20-25% ในการพูดโดยพลการ

เมื่อสองปีที่แล้ว นักวิจัยจาก Microsoft Research และ University of Toronto ได้สร้างความก้าวหน้าอีกครั้ง ด้วยการใช้เทคนิคที่เรียกว่า Deep Neural Networks ซึ่งมีรูปแบบตามพฤติกรรมของสมองของมนุษย์ นักวิจัยสามารถฝึกการจดจำคำพูดที่มีการเลือกปฏิบัติและดีกว่าวิธีการก่อนหน้านี้

ในระหว่างการนำเสนอในวันที่ 25 ตุลาคมที่ประเทศจีน ข้าพเจ้ามีโอกาสแสดงผลงานล่าสุดของงานนี้ เราสามารถลดอัตราความผิดพลาดของคำในการพูดได้มากกว่า 30% เมื่อเทียบกับวิธีการก่อนหน้า ซึ่งหมายความว่าแทนที่จะมีคำเดียวใน 4 หรือ 5 ที่ไม่ถูกต้อง ตอนนี้อัตราความผิดพลาดคือหนึ่งคำใน 7 หรือ 8 แม้ว่าจะยังห่างไกลจากความสมบูรณ์แบบ แต่นี่เป็นการเปลี่ยนแปลงความแม่นยำที่น่าทึ่งที่สุดนับตั้งแต่มีการนำแบบจำลอง Markov ที่ซ่อนอยู่มาใช้ในปี 1979 และเมื่อเราเพิ่มข้อมูลในการฝึกอบรมมากขึ้น เราเชื่อว่าเราจะได้ผลลัพธ์ที่ดียิ่งขึ้นไปอีก

ต่อมาเขาได้สาธิตสดผลงานของสิ่งที่พวกเขากำลังทำโดยการแปลสิ่งที่เขาพูดในภาษาอังกฤษเป็นภาษาจีนภายในไม่กี่วินาทีล่าช้า ดูวิดีโอด้านบนเพื่อดูความมหัศจรรย์!

ผ่าน: ถัดไปที่ Microsoft

ข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อต่างๆ: ไมโครซอฟท์, การวิจัย, การพูด

เขียนความเห็น

ที่อยู่อีเมลของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมาย *