Microsoft のカスタム ニューラル音声機能を使用すると、非常にリアルで人間のような音声を作成できます。

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

Microsoftカスタムニューラルボイス

Microsoftカスタムニューラルボイス

Microsoftは本日、Azure CognitiveServicesのSpeechServiceの一部であるText-to-Speech機能であるCustomNeuralVoiceの一般提供を発表しました。 この機能により、Microsoftの画期的なニューラルテキスト読み上げモデルを使用して、アプリケーション用の非常にリアルで人間らしいカスタム音声を作成できます。 作成された音声は非常にリアルであるため、Microsoftは、ユーザーが責任を持ってこのテクノロジを利用できるようにアクセスを制限しています。

責任あるAIへのマイクロソフトの取り組みの一環として、個人と社会の権利を保護し、人間とコンピューターの透過的な相互作用を促進し、有害なディープフェイクや誤解を招くコンテンツの急増に対抗することを目的として、カスタムニューラルボイスを設計およびリリースしています。 このため、カスタムニューラルボイスへのアクセスと使用を制限しています。

カスタムボイスを作成するには、音声を録音してトレーニングデータとしてアップロードするだけです。 Azure Speech Serviceは、録音用に調整された独自の音声を作成します。 Custom Neural Voiceのリアルで自然な響きの音声は、ブランドを表すことができ、ユーザーが自然な方法でアプリと会話できるようにします。 Microsoftは、以下の顧客がすでにこの最新のTTS機能を使用していることを強調しました。

  • AT&T /ワーナーブラザース 彼らは最近、テキサス州ダラスのAT&Tエクスペリエンスストアで、顧客がバッグスバニーと直接話すことができる、初めてのクリエイティブでインタラクティブな体験を開始しました。
  • プログレッシブ。 プログレッシブは、象徴的なプログレッシブインシュアランスのスポークスパーソンであるFloの声を使用して、顧客の問い合わせプロセスを合理化し、パーソナライズされたエクスペリエンスを提供するFloチャットボットを作成しました。
  • デュオリンゴ。 Duolingoは、新しい言語の学習を達成可能で、風変わりなキャラクターと高品質のコンテンツで適用できるようにするために、Duolingoカリキュラムを使用してさまざまな定型化された声のキャストを作成しました。

カスタムニューラルボイスについて詳しく知ることができます こちら.

情報源: Microsoft

トピックの詳細: カスタムニューラルボイス, マイクロソフト