Microsoftは、Macおよびモバイルプラットフォーム上のMicrosoftTeamsにAIベースのノイズ抑制をもたらします

読書時間アイコン 3分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

マイクロソフトのチーム

マイクロソフトのチーム

先月、マイクロソフト 発表の Microsoft TeamsWindowsデスクトップユーザーへのリアルタイムバックグラウンドAIベースのノイズ抑制機能の展開。 この機能により、Teamsの通話中に紙をシャッフルしたり、ドアを閉めたり、犬を吠えたりするなどの不要なノイズを抑えることができます。 AIベースのノイズ抑制は、個人のオーディオフィードを分析し、特別に訓練されたディープニューラルネットワークを使用してノイズを除去し、音声信号のみを保持することで機能します。 Microsoftは本日、Macおよびモバイルプラットフォーム上のMicrosoftTeamsにAIベースのノイズ抑制をもたらすために取り組んでいることを発表しました。

マイクロソフトは本日、実際の顧客データを使用せずにこの機能を開発した方法についても説明しました。 Microsoftは、ディープラーニングモデルを最適化して、Teamsデスクトップクライアント上でオーバーヘッドをあまりかけずにリアルタイムで効率的に実行できるようにしました。

このデータセットの多様性を実現するために、約760時間のクリーンな音声データと180時間のノイズデータを含む大規模なデータセットを作成しました。 マイクロソフトの厳格なプライバシー基準に準拠するために、このデータセットの顧客データが収集されないようにしました。 代わりに、公開されているデータまたはクラウドソーシングを使用して特定のシナリオを収集しました。 クリーンなスピーチでは、女性と男性のスピーチのバランスを確保し、10以上の言語からデータを収集しました。これには、モデルが単語のトーンを歪めて文の意味を変えないようにするために、声調言語も含まれています。 ノイズデータには、キーボード入力からトイレの水洗やいびきまで、お客様が遭遇する可能性のあるさまざまなシナリオを確実にカバーするために、150種類のノイズを含めました。 もう一つの重要な側面は、笑いや泣き声などの表現が抑制されないように、私たちのきれいなスピーチに感情を含めることでした。 お客様がオンラインのTeamsミーティングに参加する環境の特性は、音声信号にも大きな影響を与えます。 その多様性を捉えるために、3,000を超える実際の部屋環境と115,000を超える合成的に作成された部屋からのデータを使用してモデルをトレーニングしました。

ディープラーニングを使用するため、強力なモデルトレーニングインフラストラクチャを用意することが重要です。 Microsoft Azureを使用して、チームがMLモデルの改良バージョンを開発できるようにします。 もうXNUMXつの課題は、ノイズから元のクリーンな音声を抽出する必要があることです。これは、人間の耳が自然で心地よいと感じる方法で行う必要があります。 人間の知覚と高い相関関係がある客観的な指標がないため、処理されたオーディオサンプルをクラウドソーシングベンダーに送信できるフレームワークを開発しました。クラウドソーシングベンダーでは、人間のリスナーがオーディオ品質をXNUMX〜XNUMXつ星のスケールで評価して平均オピニオン評点を生成しました。 (MOS)。 これらの人間による評価により、主観的な人間による評価とともに、深層学習モデルの品質の向上を迅速に進めることができる新しい知覚指標を開発することができました。

Teamsでノイズ抑制機能を有効にする方法は次のとおりです。

  1. チームの右上にあるプロフィール写真を選択してから、 設定.
  2. 選択 Devices 左側に、そして下に ノイズ抑制、 選択肢一つを選択してください。

  3. ミーティングウィンドウから:
    1. 選択 より多くのオプション  会議のコントロールで、を選択します デバイスの設定.
    2.  ノイズ抑制、 選択肢一つを選択してください。

情報源: Microsoft

トピックの詳細: マイクロソフト, マイクロソフトのチーム, チーム