マイクロソフトは、XNUMXつのデータサイエンスユーティリティの公開を発表しました

読書時間アイコン 1分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

cortana-インテリジェンス-スイート

データサイエンティストは、ほとんどの場合、以下の質問に対する回答を探すコードの作成にかなりの時間を費やしています。

  • データはどのように見えますか? スキーマは何ですか?
  • データの品質はどれくらいですか? 欠測データの重大度はどのくらいですか?
  • 個々の変数はどのように分散されますか? 変数変換を行う必要がありますか?
  • データは機械学習タスクにどの程度関連していますか? 機械学習タスク自体はどのくらい難しいですか?
  • 機械学習ターゲットに最も関連する変数はどれですか?
  • データに特定のクラスタリングパターンはありますか?
  • データのMLモデルはどのように機能しますか? モデルで重要な変数はどれですか?

コードの多くはデータサイエンスユーティリティに一般化でき、プロジェクト全体で再利用できるため、データサイエンティストは、ガイドモードでプロジェクト内の特定のタスクに取り組み、基盤となるタスクの一貫性と完全性を確保できます。 データサイエンティストを支援するために、マイクロソフトはXNUMXつのデータサイエンスユーティリティをリリースしています。

  1. インタラクティブなデータ探索、分析、およびレポート(IDEAR)、および
  2. 自動モデリングおよびレポート(AMAR)。

CRAN-Rで実行されるこれらのXNUMXつのユーティリティには、次の場所からアクセスできます。 このGitHubサイト.

これらのユーティリティについてもっと読む こちら.

トピックの詳細: 分析, コルタナ インテリジェンス スイート, データ探査, データサイエンス, 機械学習, マイクロソフト