MicrosoftがSpeechto Text AICognitiveサービスを開発者にリリースする準備をしています

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

独自のバージョンのAmazonEchoを作成する場合は、独自の音声認識エンジンのローリングに多くの時間を費やすか、Microsoftが開発者にリリースする準備ができているMicrosoftの新しいCognitiveServicesを利用することができます。

Microsoftは、カスタムスピーチサービス、コンテンツモデレーター、Bing Speech APIを開発者にリリースする準備をしています。これは、Microsoftが最終的に利用できるようになる3のコグニティブサービスツールのうちの25つです。

カスタム音声サービスツールは、Microsoftの音声テキストエンジンを開発者が提供するデータに適用します。Microsoftは、専門用語、会話、アクセントを使用して、ノイズの多い領域を実行するように音声認識アルゴリズムを調整しました。

コンテンツモデレーターを使用すると、ユーザーは公開前に画像、テキスト、およびビデオデータを隔離および確認でき、Bing Speech APIは音声をテキストに変換し、テキストを音声に変換します。

このサービスはMicrosoftのボットフレームワークでうまく機能しますが、独立して使用することもでき、開発者はアプリに機能を簡単に追加できます。

カスタムスピーチサービスツールは現在プレビューで利用可能ですが、コンテンツモデレーターとBing SpeechAPIは2017年XNUMX月に一般的に利用可能になります。

これまでに424,000か国で60人を超える開発者がマイクロソフトのコグニティブサービスを試しており、このテクノロジーがAlexaスタイルのデバイスに次のような形で適用されていることをすでに確認しています。 上記のマテルアリストテレス.

これらのサービスを利用する方法についてもっと読む ここマイクロソフトで.

トピックの詳細: ai, コグニティブサービス, マイクロソフト

コメントを残す

あなたのメールアドレスは公開されません。 必須フィールドは、マークされています *