微軟研究院正在研究一種識別無聲語音命令的技術

首頁 » Microsoft微軟

閱讀時間圖標 2分鐘讀

日曆圖標發表於 2018 年 10 月 16 日

by 安莫爾·梅赫羅特拉

發表於 2018 年 10 月 16 日

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

微軟一直在開發一種新的語音輸入界面，該界面將允許用戶在沒有語音洩漏的情況下說話和錄音。該研究由 Microsoft Research 進行，並在 UIST 2018 上發表。

該模塊名為 SilentVoice，將捕捉從嘴裡流出的空氣並錄製聲音，而不會打擾周圍的人。此外，該模塊還會過濾周圍的聲音，讓用戶即使在不受外界干擾的情況下也能捕捉到清晰的聲音。

SilentVoice 是一種全新的語音輸入接口設備，它滲透到日常生活中基於語音的自然用戶界面（NUI）。所提出的“侵入式語音”方法可以將麥克風放置在非常靠近嘴巴前部的位置，而不會受到爆音的影響，以良好的信噪比捕捉非常柔和的語音。它實現了超小（小於 39dB(A)）的語音洩漏，讓我們可以在公共和移動環境以及辦公室和家庭中使用語音輸入而不會打擾周圍的人。通過測量氣流方向，SilentVoice 可以很容易地與正常話語分離，準確率達到 98.8%；不需要激活詞。它可用於帶有經過專門訓練的語音識別器的語音激活系統；評估結果產生的單詞錯誤率 (WERs) 為 1.8%（與說話者相關的條件）和 7.0%（與說話者無關的條件），字典只有 85 個命令句。類似耳語的自然語音也可以用於實時語音通信。

- 微軟

您可以查看下面的視頻以了解其工作原理。