Microsoft の今後の「Video Breakdown」サービスにより、ビデオ検索がはるかに簡単になります
2分。 読んだ
上で公開
MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む
Microsoftは、VideoBreakdownと呼ばれる新しいサービスに取り組んでいます。 新しいサービスはMicrosoftのガレージラボによって構築されており、他のほとんどのガレージ製品と同じように非常に興味深いものです。 ビデオの内訳は、豊富な認知的洞察のおかげでビデオ検索をはるかに簡単にします。 このサービスには、顔検出、OCR、言語トランスクリプトなどのインテリジェントな機能が含まれており、ビデオの検索が非常に簡単になります。 現在、探している動画を見つけるのはかなり難しいです。たとえば、YouTubeでBuild 2016のセッションに関する動画を検索している場合は、おそらくあなたがしている動画のタイトルを正しく取得する必要があります。覚えていない。 ただし、ビデオの内訳を使用すると、言語トランスクリプトやOCRなどの機能のおかげで、探しているビデオを非常に簡単に見つけることができるはずです。 Microsoft Garageのほとんどのプロジェクトとは異なり、Video BreakdownはWebアプリのみのようですが、Microsoftは将来的に専用のモバイルアプリをリリースする可能性があります。
ビデオ内訳の主な機能のいくつかを次に示します。
-
言語トランスクリプト–音響言語モデルに基づいて音声をテキストに変換します
-
顔検出–各顔がビデオに表示されるタイミングを検索します
-
スピーカーのダイアリゼーション–誰がいつ話したかをマッピングして理解する
-
OCR –オーバーレイ、スライド、または背景としてビデオに表示されるテキストを抽出します
-
顔の識別–顔として表示される人物を理解します
-
音声アクティビティの検出–バックグラウンドノイズと音声アクティビティを分離します
-
コンテキスト検索–検索結果のコンテキストを理解する
-
感情分析–口頭または書面によるポジティブなコンテンツとネガティブなコンテンツのレベルを理解する
これらの機能は、さまざまなAzureビデオサービスにあるいくつかの機能と非常によく似ています。 ただし、Video Breakdownは、AESでエンコードされたビデオを使用した安全なストリーミングも提供します。 現在、動画の内訳は、現時点では招待状をお持ちの方のみご利用いただけます。つまり、まだご利用いただけません。 Microsoftが公開したときにお知らせします。それまでの間、下のコメントセクションで感想をお聞かせください。
あなたはチェックアウトすることができます ビデオの内訳(プレビュー)はこちら。