Microsoft の SIGMA は、現実世界のタスク向けに作られています。 HoloLens を通じて AI が目に入る仕組みです

HoloLens 2 の現実世界のタスクは私が担当します

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

キーノート

  • Microsoft が現実世界のタスク用のオープンソース プラットフォームである SIGMA を発表
  • SIGMA は複合現実と AI を融合し、HoloLens 2 を通じて段階的なガイダンスを提供します
  • タスクは事前定義または動的に行うことができ、オブジェクトの検出とユーザーのクエリを支援する言語および視覚モデルを使用できます。

マイクロソフトの研究者は、 発表の 月曜日にSIGMAを立ち上げた。これは、Sowned Interactive Guide, Monitoring, and Assistance の略で、現実世界のタスク用に作られた「オープンソースの研究プラットフォームとテストベッドのプロトタイプ」です。 

今すぐ利用可能 GitHubの, SIGMA は、複合現実と AI テクノロジーを融合した HoloLens 2 用に設計されたインタラクティブ ツールです。ガイダンスを提供したり質問に答えたりすることで、ユーザーがステップバイステップのタスクを実行できるように支援します。簡単に言うと、AI がユーザーの目に入るようにします。 

タスクは事前定義または動的に生成でき、SIGMA は言語および視覚モデルを使用して、環境内の関連オブジェクトを検出して強調表示します。また、ユーザーの質問に答えたり、Detic や SEEM などのビジョン モデルを使用して環境内のタスク関連オブジェクトを検出したりすることもできます。

「SIGMA は研究プラットフォームとして機能するように設計されました。システムをオープンソース化する私たちの目標は、他の研究者がフルスタックのインタラクティブ アプリケーションを組み立てるという基本的なエンジニアリングの課題を飛び越えられるように支援することです」と Microsoft は述べています。

SIGMA は、Platform for Sowned Intelligence フレームワーク上に構築されており、迅速なプロトタイピングを可能にし、視覚化、デバッグ、およびメンテナンスのためのツールを提供します。このシステムはクライアント サーバー アーキテクチャで設計されており、HoloLens 2 からのデータ ストリームをデスクトップ サーバーで処理し、デバイスの制限を回避できます。 

Microsoft は、かなり長い間 AI 競争の最前線に立ってきました。レドモンドに拠点を置く同社の 数十億ドル OpenAI への投資では、 AIモデルの数、 そしてその コパイロット AI ツール Windows 11/10 やモバイル デバイスなどはほんの一例です。