微软研究院正在研究一种识别无声语音命令的技术

阅读时间图标 2分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

微软一直在开发一种新的语音输入界面,该界面将允许用户在没有语音泄漏的情况下说话和录音。 该研究由 Microsoft Research 进行,并在 UIST 2018 上发表。

该模块名为 SilentVoice,将捕捉从嘴里流出的空气并录制声音,而不会打扰周围的人。 此外,该模块还会过滤周围的声音,让用户即使在不受外界干扰的情况下也能捕捉到清晰的声音。

SilentVoice 是一种新的语音输入接口设备,它渗透到日常生活中基于语音的自然用户界面(NUI)。 所提出的“侵入式语音”方法可以将麦克风放置在非常靠近嘴巴前部的位置,而不会受到爆音的影响,以良好的信噪比捕捉非常柔和的语音。 它实现了超小(小于 39dB(A))的语音泄漏,让我们可以在公共和移动环境以及办公室和家庭中使用语音输入而不会打扰周围的人。 通过测量气流方向,SilentVoice 可以很容易地从正常话语中分离出来,准确率达到 98.8%; 不需要激活词。 它可用于带有经过专门训练的语音识别器的语音激活系统; 评估结果产生的单词错误率 (WERs) 为 1.8%(与说话者相关的条件)和 7.0%(与说话者无关的条件),字典只有 85 个命令句。 类似耳语的自然语音也可以用于实时语音通信。

- 微软

您可以查看下面的视频以了解其工作原理。

该技术仍处于研究阶段,但肯定会帮助人们录制声音并在不打扰周围人的情况下工作。

Sumber: 微软; 通过: WalkingCat

有关主题的更多信息: 微软, 微软研究

发表评论

您的电邮地址不会被公开。 必填带 *