Microsoft 现已将 Apache Spark 支持集成到 Microsoft R Server for Hadoop

阅读时间图标 2分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

rsz_hadoop_developer_banner_images

微软今天宣布,他们已将对 Apache Spark 的支持集成到适用于 Hadoop 的 Microsoft R Server 中,通过本地安装将 Spark 的速度优势带给 R 用户。

  • Microsoft R 在 Apache Spark 上的强大功能:将 R Server 与 Spark 相结合,使用户能够在数千个 Spark 节点上运行 R 函数,让您可以在 1000 倍大的数据上训练模型。 此外,将五节点 Spark 集群上的 R Server 与只能在单个服务器上运行的具有 CRAN 算法的开源 R 进行比较时,R Server 在 125 倍的硬件上运行 GLM 的速度提高了 XNUMX 倍,显示了 R Server 并行化算法的综合速度和 Spark 的内存架构。
  • 面向数据科学家的免费 R 客户端: 为了进一步增强数据科学家的能力,我们最近还宣布 微软 R 客户端,一种新的免费工具,供数据科学家使用 R.R 构建高性能分析。R Client 不仅允许您使用任何开源 R 函数来分析本地工作站上的数据,它还使您能够分析远程大数据并通过将计算推送到 Microsoft R Server 的生产实例(例如 SQL Server R Services、R Server for Hadoop 和 HD Insight with Spark)来扩展分析。

微软今天还宣布,Microsoft R Server 的一个组件 DeployR 进行了重大的架构改进,使其更易于使用,支持的存储库数据库有更多选择,并且比以往更安全,改进的 Web 安全功能可以更好地防止恶意攻击,改进安装安全性和改进的安全策略管理。

下载 Microsoft R 客户端 今天。 从下面的源链接中了解更多信息。

有关主题的更多信息: 数据分析, 数据科学家, 微软, Apache Spark 上的 Microsoft R, 用于 Hadoop 的 Microsoft R 服务器, 火花