マイクロソフトは、XNUMXつのデータサイエンスユーティリティの公開を発表しました

ホーム » Azure

読書時間アイコン 1分。読んだ

カレンダーアイコン上で公開 2016 年 10 月 19 日

by プラディープ・ヴィスワフ

上の公表 2016 年 10 月 19 日

読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。

データサイエンティストは、ほとんどの場合、以下の質問に対する回答を探すコードの作成にかなりの時間を費やしています。

データはどのように見えますか？スキーマは何ですか？
データの品質はどれくらいですか？欠測データの重大度はどのくらいですか？
個々の変数はどのように分散されますか？変数変換を行う必要がありますか？
データは機械学習タスクにどの程度関連していますか？機械学習タスク自体はどのくらい難しいですか？
機械学習ターゲットに最も関連する変数はどれですか？
データに特定のクラスタリングパターンはありますか？
データのMLモデルはどのように機能しますか？モデルで重要な変数はどれですか？

コードの多くはデータサイエンスユーティリティに一般化でき、プロジェクト全体で再利用できるため、データサイエンティストは、ガイドモードでプロジェクト内の特定のタスクに取り組み、基盤となるタスクの一貫性と完全性を確保できます。データサイエンティストを支援するために、マイクロソフトはXNUMXつのデータサイエンスユーティリティをリリースしています。

インタラクティブなデータ探索、分析、およびレポート（IDEAR）、および
自動モデリングおよびレポート（AMAR）。

CRAN-Rで実行されるこれらのXNUMXつのユーティリティには、次の場所からアクセスできます。このGitHubサイト.

これらのユーティリティについてもっと読むこちら.

トピックの詳細: 分析, コルタナインテリジェンススイート, データ探査, データサイエンス, 機械学習, マイクロソフト

プラディープ・ヴィスワフ

ソフトウェアおよびサービスの専門家

Pradeep はコンピュータサイエンスとエンジニアリングの卒業生です。彼はマイクロソフトの学生パートナーでもありました。現在は大手IT企業に勤務。