微軟展示語音翻譯技術的突破

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

微軟首席研究官 Rick Rashid 在中國天津舉行的微軟亞洲研究院 21 世紀計算活動上進行了演示。 他討論了計算中的語音識別以及微軟最近在這方面的突破。

直到最近,即使是最好的語音系統在任意語音上的單詞錯誤率仍然為 20-25%。

就在兩年多以前,微軟研究院和多倫多大學的研究人員又取得了突破。 通過使用一種稱為深度神經網絡的技術,該技術以人類大腦行為為模式,研究人員能夠訓練出比以前的方法更具辨別力和更好的語音識別器。

在我 25 月 30 日在中國的演講中,我有機會展示了這項工作的最新成果。 與以前的方法相比,我們已經能夠將語音的單詞錯誤率降低 4% 以上。 這意味著,現在的錯誤率不是 5 或 7 中的一個詞不正確,而是 8 或 1979 中的一個詞。雖然仍然遠非完美,但這是自 XNUMX 年引入隱馬爾可夫模型以來,準確度上最顯著的變化,隨著我們在訓練中添加更多數據,我們相信我們會得到更好的結果。

後來,他通過在幾秒鐘內將他用英語說的所有內容翻譯成中文,對他們的工作結果進行了現場演示。 觀看上面的視頻,看看魔術!

通過: 接下來在微軟

有關主題的更多資訊: 微軟, 研究, 發言

發表評論

您的電子郵件地址將不會被發表。 必填字段標 *