微軟的語音辨識技術現在比以往任何時候都更加準確

閱讀時間圖標 2分鐘讀

日曆圖標發表於 2017 年 8 月 21 日

發表於 2017 年 8 月 21 日

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

微軟的語音識別技術剛剛達到人類水平的準確性。該公司的研究團隊宣布，其語音識別系統現在的單詞錯誤率 (WER) 僅為 5.1%。這低於該系統之前 5.9% 的 WER。雷德蒙德在過去一年中一直在不斷推進其語音識別系統，並且能夠將其從之前的 5.1% 降低到 6.3 月實現的 XNUMX% WER 去年的。去年，該公司將錯誤率降低了 12%。

以前的報告表明，人字錯誤率是目前為 5,1%，這意味著微軟的語音識別系統實際上與人類一樣準確。這對微軟來說是一項相當巨大的成就，因為它在過去 25 年裡一直在努力實現與人類平等的目標。

Redmond 詳細介紹了它如何使用卷積神經網絡和雙向長短期記憶的組合來降低錯誤率。技術報告. 微軟的工程師也一直致力於改進其基於神經網絡的聲學和語言模型，以提高單詞錯誤率。該公司還聲稱，其對雲業務的投資為其聲學和語言模型提供了更快的培訓過程。

微軟在 Windows、Cortana、Office、認知服務中使用的語音識別技術以及更高的準確性可能會在未來幾個月使幾乎所有客戶受益。

有關主題的更多資訊： CNN, 柯塔娜, 微軟, 語音識別, WER, 字錯誤率

梅赫迪·哈桑

科技記者

Mehedi Hassan 是 MSPowerUser.com 的新聞記者。他涵蓋科技界的所有最新新聞。

發表評論