Microsoft อวดความก้าวหน้าในเทคโนโลยีการแปลคำพูด
2 นาที. อ่าน
เผยแพร่เมื่อ
อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม
Rick Rashid หัวหน้าเจ้าหน้าที่วิจัยของ Microsoft สาธิตในเมืองเทียนจิน ประเทศจีน ที่งาน Microsoft Research Asia's 21st Century Computing เขาพูดคุยเกี่ยวกับการรู้จำเสียงในการประมวลผลและความก้าวหน้าล่าสุดที่ Microsoft มีอยู่ในนั้น
จนกระทั่งเมื่อเร็วๆ นี้ แม้แต่ระบบคำพูดที่ดีที่สุดยังคงมีอัตราความผิดพลาดของคำอยู่ที่ 20-25% ในการพูดโดยพลการ
เมื่อสองปีที่แล้ว นักวิจัยจาก Microsoft Research และ University of Toronto ได้สร้างความก้าวหน้าอีกครั้ง ด้วยการใช้เทคนิคที่เรียกว่า Deep Neural Networks ซึ่งมีรูปแบบตามพฤติกรรมของสมองของมนุษย์ นักวิจัยสามารถฝึกการจดจำคำพูดที่มีการเลือกปฏิบัติและดีกว่าวิธีการก่อนหน้านี้
ในระหว่างการนำเสนอในวันที่ 25 ตุลาคมที่ประเทศจีน ข้าพเจ้ามีโอกาสแสดงผลงานล่าสุดของงานนี้ เราสามารถลดอัตราความผิดพลาดของคำในการพูดได้มากกว่า 30% เมื่อเทียบกับวิธีการก่อนหน้า ซึ่งหมายความว่าแทนที่จะมีคำเดียวใน 4 หรือ 5 ที่ไม่ถูกต้อง ตอนนี้อัตราความผิดพลาดคือหนึ่งคำใน 7 หรือ 8 แม้ว่าจะยังห่างไกลจากความสมบูรณ์แบบ แต่นี่เป็นการเปลี่ยนแปลงความแม่นยำที่น่าทึ่งที่สุดนับตั้งแต่มีการนำแบบจำลอง Markov ที่ซ่อนอยู่มาใช้ในปี 1979 และเมื่อเราเพิ่มข้อมูลในการฝึกอบรมมากขึ้น เราเชื่อว่าเราจะได้ผลลัพธ์ที่ดียิ่งขึ้นไปอีก
ต่อมาเขาได้สาธิตสดผลงานของสิ่งที่พวกเขากำลังทำโดยการแปลสิ่งที่เขาพูดในภาษาอังกฤษเป็นภาษาจีนภายในไม่กี่วินาทีล่าช้า ดูวิดีโอด้านบนเพื่อดูความมหัศจรรย์!
ผ่าน: ถัดไปที่ Microsoft