微軟宣佈公開推出兩款數據科學實用程序

閱讀時間圖標 1分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

cortana 智能套件

數據科學家大部分時間花費大量時間編寫代碼來尋找以下問題的答案。

  • 數據是什麼樣的? 架構是什麼?
  • 數據質量如何? 數據缺失的嚴重程度如何?
  • 單個變量如何分佈? 我需要做變量轉換嗎?
  • 數據與機器學習任務的相關性如何? 機器學習任務本身有多難?
  • 哪些變量與機器學習目標最相關?
  • 數據中是否有任何特定的聚類模式?
  • 數據上的 ML 模型將如何執行? 模型中哪些變量是顯著的?

大部分代碼可以推廣到數據科學實用程序中,這些實用程序可以跨項目重用,幫助數據科學家以指導模式處理項目中的特定任務,確保底層任務的一致性和完整性。 為了幫助數據科學家,微軟正在發布兩個數據科學實用程序,

  1. 交互式數據探索、分析和報告 (IDEAR),以及
  2. 自動建模和報告 (AMAR)。

這兩個在 CRAN-R 中運行的實用程序可以從 這個 GitHub 網站.

閱讀有關這些實用程序的更多信息 点击這裡.

有關主題的更多資訊: 分析, Cortana 智能套件, 數據探索, 數據科學, 機器學習, 微軟