Skype 翻译器的工作原理：幕后（视频）

阅读时间图标 3分钟读

日历图标发表于 2014 年 12 月 15 日

发表于 2014 年 12 月 15 日

读者帮助支持 MSpoweruser。如果您通过我们的链接购买，我们可能会获得佣金。

几个小时前，微软宣布了 Skype Translator 预览计划的第一阶段，该计划将从英语和西班牙语作为前两种语言开始。 Skype Translator 是数十年来语音识别、自动翻译和通用机器学习技术研究的成果。 Skype Transaltor 背后的主要技术之一是语音识别方面的最新改进，通过引入深度神经网络与微软久经考验的统计机器翻译技术相结合，实现了更好的翻译结果，使有意义的一对一对话成为可能。

如何运作的？

机器学习是从训练数据示例中进行软件学习的能力，Skype Translator 建立在强大的机器学习平台之上。通过在此预览阶段学习训练数据及其所有细微差别，该软件可以学习更好地识别和翻译实际 Skype 翻译用户的主题、口音和语言变化的多样性。

Skype Translator 的机器学习协议训练和优化语音识别 (SR) 和自动机器翻译 (MT) 任务，充当将这些元素结合在一起的粘合剂。这种“胶水”会转换已识别的文本以促进翻译。这个过程包括去除不流利的地方（即“ahs”和“umms”以及重新措辞），将文本分成句子，以及添加标点符号和大写字母。

语音识别和机器翻译的训练数据来自多种来源，包括翻译的网页、带字幕的视频，以及以前翻译和转录的一对一对话。 Skype 翻译记录对话以分析脚本并训练系统以更好地学习每种语言。我们也有很多人从之前的对话中捐赠数据，我们还分析并使用这些数据为统计模型创建培训材料，这些模型教语音识别和机器翻译引擎如何将传入的音频流映射到文本，然后将文本映射到文本。另一种语言。 Skype 翻译参与者在通话开始时都会收到明确的通知，他们的对话将被记录下来并用于提高微软翻译和语音识别服务的质量。

在数据准备好并输入机器学习系统后，机器学习软件会为这些对话中的单词及其上下文建立一个统计模型。当你说话时，该软件可以在其统计模型中找到类似的东西，并应用之前学习的从音频到文本以及从文本到外语的转换。

虽然语音识别几十年来一直是一个重要的研究课题，但该技术的广泛采用一直受到高错误率和对说话人变化、噪声条件等的敏感性的阻碍。由微软开创的用于语音识别的深度神经网络 (DNN) 的出现研究显着降低了错误率并提高了稳健性，最终使这项技术能够在广泛的环境中使用，例如 Skype 翻译。同时，全球人与人交流的梦想是 MSR 研究人员致力于这项技术的主要动力和驱动力。

继续详细阅读相关信息.

通过： Skype

有关主题的更多信息：背后的场景, 机器学习, 微软, 研究, SKYPE, 翻译者

微软新闻

新闻中心

Microsoft News 是 MSPowerUser 的前新闻编辑室团队。今天，我们与各种记者和报道合作，他们向我们提供新闻和事件。