IBM 在語音識別準確性方面擊敗了微軟

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

去年,微軟在語音識別方面取得了令人印象深刻的突破。 該公司聲稱其語音識別技術達到 “人類平等”只有 5.9% WER(字錯誤率)。 而現在,IBM 憑藉其語音識別技術實現了更低的 WER。 該公司聲稱它已經實現了 5.5% 的單詞錯誤率,比微軟 5.9% 的記錄高出 0.4%。

微軟以前 打破 IBM 6.9% 的 WER 記錄 早在 6.3 年 2016 月就實現了 XNUMX% 的錯誤率。因此,微軟可能很快就會回擊 IBM。

有趣的是,IBM 聲稱該公司尚未達到與人類平等的水平。 與微軟不同的是,IBM 聲稱人類平等的 WER 為 5.1%——這是任何語音識別技術都無法實現的。 IBM 首席研究科學家 George Saon 說:

“達到人類平等——意味著與兩個人說話的錯誤率相當——長期以來一直是最終的行業目標。 業內其他人正在與我們一起追逐這一里程碑,有些人最近聲稱達到了相當於人類平等的 5.9%……但我們還沒有開香檳。 作為我們實現今天里程碑的過程的一部分,我們確定人類平等實際上低於任何人尚未達到的水平——5.1%。”

IBM 在一篇博文中表示,通過結合 LSTM(長短期記憶)和 WaveNet 語言模型,該公司能夠實現比微軟更低的錯誤率。

有關主題的更多資訊: 柯塔娜, IBM, IBM 實驗室, IBM 語音識別, 微軟, 微軟研究, MSR, 語音識別

發表評論

您的電子郵件地址將不會被發表。 必填字段標 *