微軟為 DeepSpeed 註冊商標,他們的 1 萬億參數 AI 庫

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

極速

微軟已經為 DeepSpeed 申請了商標,這是他們優化的人工智能庫,允許在適度的硬件上訓練大規模人工智能模型。

該商標於 8 年 2020 月 XNUMX 日提交,提及“提供用於人工智能處理和深度學習的在線不可下載計算機軟件的臨時使用,”暗示微軟可能正在考慮通過在線雲服務提供 DeepSpeed。

今年 800 月發布的 DeepSpeed 是一個 Python 庫,僅使用 100 塊 Nvidia V4,000 顯卡,就可以創建具有萬億參數的深度學習模型,是目前世界上最大模型的五倍多。 如果沒有 DeepSpeed,同樣的任務需要 100 台 Nvidia A2.5,比 V100 快 100 倍,運行 XNUMX 天。

在 GPT-3 顯示模型繼續改進更大的神經網絡和數據集之後,該工具特別有用。 然而,這確實有可能將最新的創新推向資源較少的小型團隊,但 DeepSpeed 允許這些團隊以最少的硬件與更大的服務競爭。 轉向雲處理可以使大型模型 AI 訓練更容易獲得。

閱讀有關 Microsoft DeepSpeed 的更多信息 点击這裡,並查看商標 点击這裡.

通過 鋁礬土