微软展示语音翻译技术的突破

阅读时间图标 2分钟读

日历图标发表于 2012 年 11 月 8 日

发表于 2012 年 11 月 8 日

读者帮助支持 MSpoweruser。如果您通过我们的链接购买，我们可能会获得佣金。

微软首席研究官 Rick Rashid 在中国天津举行的微软亚洲研究院 21 世纪计算活动上进行了演示。他讨论了计算中的语音识别以及微软最近在这方面的突破。

直到最近，即使是最好的语音系统在任意语音上的单词错误率仍然为 20-25%。

就在两年多前，微软研究院和多伦多大学的研究人员取得了另一项突破。通过使用一种称为深度神经网络的技术，该技术以人类大脑行为为模式，研究人员能够训练出比以前的方法更具辨别力和更好的语音识别器。

在我 25 月 30 日在中国的演讲中，我有机会展示了这项工作的最新成果。与以前的方法相比，我们已经能够将语音的单词错误率降低 4% 以上。这意味着，现在的错误率不是 5 或 7 中的一个词不正确，而是 8 或 1979 中的一个词。虽然仍然远非完美，但这是自 XNUMX 年引入隐马尔可夫模型以来，准确度上最显着的变化，随着我们在训练中添加更多数据，我们相信我们会得到更好的结果。

后来，他通过在几秒钟内将他用英语说的所有内容翻译成中文，对他们的工作结果进行了现场演示。观看上面的视频，看看魔术！

通过：接下来在微软

有关主题的更多信息：微软, 研究, 发言

微软新闻

新闻中心

Microsoft News 是 MSPowerUser 的前新闻编辑室团队。今天，我们与各种记者和报道合作，他们向我们提供新闻和事件。

发表评论