微软为 DeepSpeed 注册商标,他们的 1 万亿参数 AI 库

阅读时间图标 2分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

深速

微软已经为 DeepSpeed 申请了商标,这是他们优化的人工智能库,允许在适度的硬件上训练大规模人工智能模型。

该商标于 8 年 2020 月 XNUMX 日提交,提及“提供用于人工智能处理和深度学习的在线不可下载计算机软件的临时使用,”暗示微软可能正在考虑通过在线云服务提供 DeepSpeed。

今年 800 月发布的 DeepSpeed 是一个 Python 库,仅使用 100 块 Nvidia V4,000 显卡,就可以创建具有万亿参数的深度学习模型,是目前世界上最大模型的五倍多。 如果没有 DeepSpeed,同样的任务需要 100 台 Nvidia A2.5,比 V100 快 100 倍,运行 XNUMX 天。

在 GPT-3 显示模型继续改进更大的神经网络和数据集之后,该工具特别有用。 然而,这确实威胁到资源较少的小型团队无法获得最新的创新,但 DeepSpeed 允许这些团队以最少的硬件与更大的服务竞争。 转向云处理可以使大型模型 AI 训练更容易获得。

阅读有关 Microsoft DeepSpeed 的更多信息 此处,并查看商标 此处.

通过 铝矾土