マイクロソフトは、4つのAIリーダーボードを突破して王冠を獲得しました

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

MicrosoftはGoogleのDeepmindがGoを打ち負かすほど派手なことは何もしていませんが、MicrosoftのAI研究者は依然として非常にうまくやっています。

ブログ投稿で、DeveloperPlatformのコーポレートバイスプレジデントであるSteveGuggenheimerは、この分野でのMicrosoftの業績について自慢し、同社は複雑なビジネスインテリジェンスの課題への対処とアクションの提供に非常に適したソリューションを備えたXNUMXつの独立したAIベンチマークのリーダーであると述べました。企業顧客への洞察。

4つのリーダーボードは次のとおりです。

  1. 分隊1.1 (Stanford Question Answer Dataset):SQUADテストは、AIにドキュメントを読んで、これに関連する質問に答えるように依頼します。 この機械読解(MRC)テストでは、MicrosoftのAIが人間だけでなく質問も読んで答えることができるようになりました。
  2. スタンフォードSQuAD2.0 読解テスト:2018年2.0月、「知らないことを知っている読解システムの開発を促進する」ために、SQuADバージョン1がリリースされました。 マイクロソフトは現在、SQuAD 2.0で1位を占めており、全体で上位1.1位のうちXNUMX位を占めていますが、同時にSQuADXNUMXでもXNUMX位を維持しています。
  3. SalesforceWikiSQLチャレンジ:これは、WikiSQLと呼ばれるウィキペディアに基づく大規模なクラウドソーシングデータセットを使用し、データセットから自然言語の質問に答えるのにAIが必要です。 通常はSalesforceが主導し、今月初め、MicrosoftはIncSQLと呼ばれる新しいアプローチでSalesforceのリーダーボードでトップの座を獲得しました。 テスト実行の大幅な改善(81.4%から87.1%)は、MicrosoftResearchとビジネスアプリケーショングループの科学者間のコラボレーションの結果です。
  4. アレン人工知能研究所の推論チャレンジ (ARC):ARC質問応答チャレンジは、質問応答のアプローチをテストするために設計された、7,787の小学校レベルの多肢選択式オープンドメイン質問のデータセットを提供します。 最上位のアプローチであり、重要な用語を認識しています–レトリバーリーダー(ET-RR)は、サンディエゴ大学のインターンと協力してMicrosoft Dynamics 365+AI研究チームによって共同開発されました。 リーダーボードの第3位は、SunYat-SenUniversityの研究者とMicrosoftResearchAsiaで構成される別の研究チームです。

Microsoftは、これらの課題に参加することによって開発されたテクノロジは、XNUMX月に出荷される製品にすでに組み込まれていると述べています。

テストとMicrosoftのパフォーマンスについてもっと読む スティーブのブログ投稿はこちら.

トピックの詳細: ai, マイクロソフト, マイクロソフトリサーチ