微软宣布公开推出两款数据科学实用程序
1分钟读
发表于
读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。
阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多
数据科学家大部分时间花费大量时间编写代码来寻找以下问题的答案。
- 数据是什么样的? 架构是什么?
- 数据质量如何? 数据缺失的严重程度如何?
- 单个变量如何分布? 我需要做变量转换吗?
- 数据与机器学习任务的相关性如何? 机器学习任务本身有多难?
- 哪些变量与机器学习目标最相关?
- 数据中是否有任何特定的聚类模式?
- 数据上的 ML 模型将如何执行? 模型中哪些变量是显着的?
大部分代码可以推广到数据科学实用程序中,这些实用程序可以跨项目重用,帮助数据科学家以指导模式处理项目中的特定任务,确保底层任务的一致性和完整性。 为了帮助数据科学家,微软正在发布两个数据科学实用程序,
- 交互式数据探索、分析和报告 (IDEAR),以及
- 自动建模和报告 (AMAR)。
这两个在 CRAN-R 中运行的实用程序可以从 这个 GitHub 网站.
阅读有关这些实用程序的更多信息 此处.