微軟的語音辨識技術現在比以往任何時候都更加準確

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

微軟的語音識別技術剛剛達到人類水平的準確性。 該公司的研究團隊宣布,其語音識別系統現在的單詞錯誤率 (WER) 僅為 5.1%。 這低於該系統之前 5.9% 的 WER。 雷德蒙德在過去一年中一直在不斷推進其語音識別系統,並且能夠將其從之前的 5.1% 降低到 6.3 月實現的 XNUMX% WER 去年的。 去年,該公司將錯誤率降低了 12%。

以前的報告表明,人字錯誤率是 目前為 5,1%,這意味著微軟的語音識別系統實際上與人類一樣準確。 這對微軟來說是一項相當巨大的成就,因為它在過去 25 年裡一直在努力實現與人類平等的目標。

Redmond 詳細介紹了它如何使用卷積神經網絡和雙向長短期記憶的組合來降低錯誤率。 技術報告. 微軟的工程師也一直致力於改進其基於神經網絡的聲學和語言模型,以提高單詞錯誤率。 該公司還聲稱,其對雲業務的投資為其聲學和語言模型提供了更快的培訓過程。

微軟在 Windows、Cortana、Office、認知服務中使用的語音識別技術以及更高的準確性可能會在未來幾個月使幾乎所有客戶受益。

有關主題的更多資訊: CNN, 柯塔娜, 微軟, 語音識別, WER, 字錯誤率

發表評論

您的電子郵件地址將不會被發表。 必填字段標 *