微軟研究院正在研究一種識別無聲語音命令的技術

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

微軟一直在開發一種新的語音輸入界面,該界面將允許用戶在沒有語音洩漏的情況下說話和錄音。 該研究由 Microsoft Research 進行,並在 UIST 2018 上發表。

該模塊名為 SilentVoice,將捕捉從嘴裡流出的空氣並錄製聲音,而不會打擾周圍的人。 此外,該模塊還會過濾周圍的聲音,讓用戶即使在不受外界干擾的情況下也能捕捉到清晰的聲音。

SilentVoice 是一種全新的語音輸入接口設備,它滲透到日常生活中基於語音的自然用戶界面(NUI)。 所提出的“侵入式語音”方法可以將麥克風放置在非常靠近嘴巴前部的位置,而不會受到爆音的影響,以良好的信噪比捕捉非常柔和的語音。 它實現了超小(小於 39dB(A))的語音洩漏,讓我們可以在公共和移動環境以及辦公室和家庭中使用語音輸入而不會打擾周圍的人。 通過測量氣流方向,SilentVoice 可以很容易地與正常話語分離,準確率達到 98.8%; 不需要激活詞。 它可用於帶有經過專門訓練的語音識別器的語音激活系統; 評估結果產生的單詞錯誤率 (WERs) 為 1.8%(與說話者相關的條件)和 7.0%(與說話者無關的條件),字典只有 85 個命令句。 類似耳語的自然語音也可以用於實時語音通信。

- 微軟

您可以查看下面的視頻以了解其工作原理。

該技術仍處於研究階段,但肯定會幫助人們錄製聲音並在不打擾周圍人的情況下工作。

資源: Microsoft微軟; 通過: WalkingCat

有關主題的更多資訊: 微軟, 微軟研究

發表評論

您的電子郵件地址將不會被發表。 必填字段標 *