微软将为 Mac 和移动平台上的 Microsoft Teams 带来基于 AI 的噪音抑制

阅读时间图标 3分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

微软团队

微软团队

上个月,微软 公布 向 Microsoft Teams Windows 桌面用户推出实时后台基于 AI 的噪音抑制功能。 此功能可以抑制不必要的噪音,例如在 Teams 通话期间洗纸、关门和狗吠。 基于 AI 的噪声抑制通过分析个人的音频输入并使用经过特殊训练的深度神经网络过滤噪声并仅保留语音信号来工作。 微软今天宣布,它正在努力为 Mac 和移动平台上的 Microsoft Teams 带来基于 AI 的噪音抑制功能。

微软今天还解释了他们如何在不使用实际客户数据的情况下开发此功能。 Microsoft 优化了深度学习模型,使其可以在 Teams 桌面客户端上实时高效运行,而无需太多开销。

为了实现这种数据集的多样性,我们创建了一个包含大约 760 小时干净语音数据和 180 小时噪声数据的大型数据集。 为了遵守 Microsoft 严格的隐私标准,我们确保不会为此数据集收集任何客户数据。 相反,我们要么使用公开数据或众包来收集特定场景。 对于干净的语音,我们确保了女性和男性语音的平衡,并且我们从 10 多种语言中收集了数据,其中还包括声调语言,以确保我们的模型不会通过扭曲单词的语气来改变句子的含义。 对于噪音数据,我们包括了 150 种噪音类型,以确保我们涵盖客户可能遇到的各种场景,从键盘打字到冲厕所或打鼾。 另一个重要的方面是在我们干净的演讲中包含情绪,这样笑声或哭声等表情就不会受到抑制。 我们的客户加入其在线 Teams 会议的环境特征也对语音信号有很大影响。 为了捕捉这种多样性,我们使用来自 3,000 多个真实房间环境和 115,000 多个合成创建的房间的数据来训练我们的模型。

由于我们使用深度学习,因此拥有强大的模型训练基础设施非常重要。 我们使用 Microsoft Azure 允许我们的团队开发我们的 ML 模型的改进版本。 另一个挑战是从噪声中提取原始干净的语音需要以人耳认为自然和愉快的方式进行。 由于没有与人类感知高度相关的客观指标,我们开发了一个框架,允许我们将处理后的音频样本发送给众包供应商,在那里人类听众对他们的音频质量进行 XNUMX 到 XNUMX 星评级,以产生平均意见分数(MOS)。 通过这些人工评分,我们能够开发出一种新的感知指标,该指标与主观的人工评分一起使我们能够在提高深度学习模型的质量方面取得快速进展。

以下是在 Teams 中启用噪音抑制功能的方法:

  1. 选择 Teams 右上角的个人资料图片,然后选择 个人设置.
  2. 选择 设备 在左边,然后,在下面 噪音抑制, 选择一个选项。

  3. 从会议窗口:
    1. 选择 更多的选择  在您的会议控件中,然后选择 设备设置.
    2. 下 噪音抑制, 选择一个选项。

Sumber: 微软

有关主题的更多信息: 微软, 微软团队, 团队