Microsoft Research vượt qua "rào cản nhận dạng giọng nói của con người"
2 phút đọc
Được đăng trên
Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm
Microsoft Research đã tạo ra một bước đột phá lớn trong nhận dạng giọng nói. Họ hiện đã phát triển một hệ thống có thể hiểu một cuộc trò chuyện tốt như một người. Hệ thống nhận dạng giọng nói của họ mắc các lỗi tương tự hoặc ít hơn so với các nhân viên phiên âm chuyên nghiệp. Các nhà nghiên cứu đã báo cáo tỷ lệ lỗi từ (WER) là 5.9%, giảm từ 6.3% WER mà nhóm đã báo cáo vào tháng trước. Đây là mức thấp nhất từng được ghi lại so với nhiệm vụ nhận dạng giọng nói tiêu chuẩn của Switchboard.
“Chúng tôi đã đạt đến sự ngang bằng của con người,” nói Tuyết Đông Hoàng, nhà khoa học phát biểu chính của công ty. "Đây là một thành tích lịch sử."
“Thậm chí XNUMX năm trước, tôi sẽ không nghĩ rằng chúng tôi có thể đạt được điều này. Tôi chỉ không nghĩ rằng điều đó sẽ có thể xảy ra, ”nói Harry Shum, phó chủ tịch điều hành, người đứng đầu nhóm Nghiên cứu và Trí tuệ Nhân tạo của Microsoft.
“Thành tựu này là đỉnh cao của hơn hai mươi năm nỗ lực,” nói Geoffrey Zweig, người quản lý nhóm nghiên cứu Speech & Dialog.
Nghiên cứu đột phá này sẽ cải thiện các tính năng nhận dạng giọng nói trong các sản phẩm khác nhau của Microsoft bao gồm các thiết bị giải trí tiêu dùng như Xbox, các công cụ trợ năng như chuyển lời nói thành văn bản tức thì và trợ lý kỹ thuật số cá nhân như Cortana.
Shum nói: “Điều này sẽ làm cho Cortana trở nên mạnh mẽ hơn, tạo ra một trợ lý thực sự thông minh.
Đọc toàn bộ câu chuyện tại đây.