マイクロソフトは、XNUMXつのデータサイエンスユーティリティの公開を発表しました
1分。 読んだ
上で公開
読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。
MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む
データサイエンティストは、ほとんどの場合、以下の質問に対する回答を探すコードの作成にかなりの時間を費やしています。
- データはどのように見えますか? スキーマは何ですか?
- データの品質はどれくらいですか? 欠測データの重大度はどのくらいですか?
- 個々の変数はどのように分散されますか? 変数変換を行う必要がありますか?
- データは機械学習タスクにどの程度関連していますか? 機械学習タスク自体はどのくらい難しいですか?
- 機械学習ターゲットに最も関連する変数はどれですか?
- データに特定のクラスタリングパターンはありますか?
- データのMLモデルはどのように機能しますか? モデルで重要な変数はどれですか?
コードの多くはデータサイエンスユーティリティに一般化でき、プロジェクト全体で再利用できるため、データサイエンティストは、ガイドモードでプロジェクト内の特定のタスクに取り組み、基盤となるタスクの一貫性と完全性を確保できます。 データサイエンティストを支援するために、マイクロソフトはXNUMXつのデータサイエンスユーティリティをリリースしています。
- インタラクティブなデータ探索、分析、およびレポート(IDEAR)、および
- 自動モデリングおよびレポート(AMAR)。
CRAN-Rで実行されるこれらのXNUMXつのユーティリティには、次の場所からアクセスできます。 このGitHubサイト.
これらのユーティリティについてもっと読む こちら.