微软展示语音翻译技术的突破

阅读时间图标 2分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

微软首席研究官 Rick Rashid 在中国天津举行的微软亚洲研究院 21 世纪计算活动上进行了演示。 他讨论了计算中的语音识别以及微软最近在这方面的突破。

直到最近,即使是最好的语音系统在任意语音上的单词错误率仍然为 20-25%。

就在两年多前,微软研究院和多伦多大学的研究人员取得了另一项突破。 通过使用一种称为深度神经网络的技术,该技术以人类大脑行为为模式,研究人员能够训练出比以前的方法更具辨别力和更好的语音识别器。

在我 25 月 30 日在中国的演讲中,我有机会展示了这项工作的最新成果。 与以前的方法相比,我们已经能够将语音的单词错误率降低 4% 以上。 这意味着,现在的错误率不是 5 或 7 中的一个词不正确,而是 8 或 1979 中的一个词。虽然仍然远非完美,但这是自 XNUMX 年引入隐马尔可夫模型以来,准确度上最显着的变化,随着我们在训练中添加更多数据,我们相信我们会得到更好的结果。

后来,他通过在几秒钟内将他用英语说的所有内容翻译成中文,对他们的工作结果进行了现场演示。 观看上面的视频,看看魔术!

通过: 接下来在微软

有关主题的更多信息: 微软, 研究, 发言

发表评论

您的电邮地址不会被公开。 必填带 *