Microsoft อวดความก้าวหน้าในเทคโนโลยีการแปลคำพูด

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน

ไอคอนปฏิทิน เผยแพร่เมื่อ November 8, 2012

เผยแพร่บน November 8, 2012

ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา

Rick Rashid หัวหน้าเจ้าหน้าที่วิจัยของ Microsoft สาธิตในเมืองเทียนจิน ประเทศจีน ที่งาน Microsoft Research Asia's 21st Century Computing เขาพูดคุยเกี่ยวกับการรู้จำเสียงในการประมวลผลและความก้าวหน้าล่าสุดที่ Microsoft มีอยู่ในนั้น

จนกระทั่งเมื่อเร็วๆ นี้ แม้แต่ระบบคำพูดที่ดีที่สุดยังคงมีอัตราความผิดพลาดของคำอยู่ที่ 20-25% ในการพูดโดยพลการ

เมื่อสองปีที่แล้ว นักวิจัยจาก Microsoft Research และ University of Toronto ได้สร้างความก้าวหน้าอีกครั้ง ด้วยการใช้เทคนิคที่เรียกว่า Deep Neural Networks ซึ่งมีรูปแบบตามพฤติกรรมของสมองของมนุษย์ นักวิจัยสามารถฝึกการจดจำคำพูดที่มีการเลือกปฏิบัติและดีกว่าวิธีการก่อนหน้านี้

ในระหว่างการนำเสนอในวันที่ 25 ตุลาคมที่ประเทศจีน ข้าพเจ้ามีโอกาสแสดงผลงานล่าสุดของงานนี้ เราสามารถลดอัตราความผิดพลาดของคำในการพูดได้มากกว่า 30% เมื่อเทียบกับวิธีการก่อนหน้า ซึ่งหมายความว่าแทนที่จะมีคำเดียวใน 4 หรือ 5 ที่ไม่ถูกต้อง ตอนนี้อัตราความผิดพลาดคือหนึ่งคำใน 7 หรือ 8 แม้ว่าจะยังห่างไกลจากความสมบูรณ์แบบ แต่นี่เป็นการเปลี่ยนแปลงความแม่นยำที่น่าทึ่งที่สุดนับตั้งแต่มีการนำแบบจำลอง Markov ที่ซ่อนอยู่มาใช้ในปี 1979 และเมื่อเราเพิ่มข้อมูลในการฝึกอบรมมากขึ้น เราเชื่อว่าเราจะได้ผลลัพธ์ที่ดียิ่งขึ้นไปอีก

ต่อมาเขาได้สาธิตสดผลงานของสิ่งที่พวกเขากำลังทำโดยการแปลสิ่งที่เขาพูดในภาษาอังกฤษเป็นภาษาจีนภายในไม่กี่วินาทีล่าช้า ดูวิดีโอด้านบนเพื่อดูความมหัศจรรย์!

ผ่าน: ถัดไปที่ Microsoft

ข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อต่างๆ: ไมโครซอฟท์, การวิจัย, การพูด

ไมโครซอฟท์ข่าว

ข่าวสาร

Microsoft News คือทีมห้องข่าวเก่าของ MSPowerUser ปัจจุบันเราทำงานร่วมกับนักข่าวและรายงานต่างๆ มากมายที่ให้ข่าวสารและกิจกรรมต่างๆ แก่เรา

เขียนความเห็น