微軟展示語音翻譯技術的突破

閱讀時間圖標 2分鐘讀

日曆圖標發表於 2012 年 11 月 8 日

發表於 2012 年 11 月 8 日

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

微軟首席研究官 Rick Rashid 在中國天津舉行的微軟亞洲研究院 21 世紀計算活動上進行了演示。他討論了計算中的語音識別以及微軟最近在這方面的突破。

直到最近，即使是最好的語音系統在任意語音上的單詞錯誤率仍然為 20-25%。

就在兩年多以前，微軟研究院和多倫多大學的研究人員又取得了突破。通過使用一種稱為深度神經網絡的技術，該技術以人類大腦行為為模式，研究人員能夠訓練出比以前的方法更具辨別力和更好的語音識別器。

在我 25 月 30 日在中國的演講中，我有機會展示了這項工作的最新成果。與以前的方法相比，我們已經能夠將語音的單詞錯誤率降低 4% 以上。這意味著，現在的錯誤率不是 5 或 7 中的一個詞不正確，而是 8 或 1979 中的一個詞。雖然仍然遠非完美，但這是自 XNUMX 年引入隱馬爾可夫模型以來，準確度上最顯著的變化，隨著我們在訓練中添加更多數據，我們相信我們會得到更好的結果。

後來，他通過在幾秒鐘內將他用英語說的所有內容翻譯成中文，對他們的工作結果進行了現場演示。觀看上面的視頻，看看魔術！

通過：接下來在微軟

有關主題的更多資訊：微軟, 研究, 發言

微軟新聞

新聞編輯室

Microsoft News 是 MSPowerUser 的前新聞編輯室團隊。今天，我們與各種記者和報道合作，他們向我們提供新聞和事件。

發表評論