Microsoft trägt die Marke DeepSpeed, ihre KI-Bibliothek mit 1 Billion Parametern

Symbol für die Lesezeit 2 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Lesen Sie weiter

Deepspeed

Microsoft hat eine Marke für DeepSpeed ​​beantragt, ihre optimierte KI-Bibliothek, die das Training großer KI-Modelle auf bescheidener Hardware ermöglicht.

Die am 8. Dezember 2020 eingereichte Marke bezieht sich auf „Ermöglichung der zeitweiligen Nutzung von nicht herunterladbarer Online-Computersoftware für die Verarbeitung künstlicher Intelligenz und Deep Learning,“, was darauf hindeutet, dass Microsoft möglicherweise darüber nachdenkt, DeepSpeed ​​über einen Online-Cloud-Dienst verfügbar zu machen.

DeepSpeed, das im Februar dieses Jahres veröffentlicht wurde, ist eine Python-Bibliothek, die die Erstellung von Deep-Learning-Modellen mit einer Billion Parametern ermöglicht, mehr als fünfmal so viele wie im derzeit größten Modell der Welt, und das mit nur 800 Nvidia V100-Grafikkarten. Ohne DeepSpeed ​​würde die gleiche Aufgabe 4,000 Nvidia A100 erfordern, die bis zu 2.5-mal schneller als die V100 sind, und 100 Tage lang knirschen.

Das Tool ist besonders nützlich, nachdem GPT-3 gezeigt hat, dass sich Modelle weiter verbessern, je größer das neuronale Netz und der Datensatz sind. Dies drohte jedoch, die neuesten Innovationen aus der Reichweite kleinerer Teams mit weniger Ressourcen zu verdrängen, aber DeepSpeed ​​hat es diesen Teams ermöglicht, mit viel größeren Diensten mit minimaler Hardware zu konkurrieren. Ein Wechsel zur Cloud-Verarbeitung könnte das KI-Training für große Modelle noch zugänglicher machen.

Lesen Sie mehr über DeepSpeed ​​bei Microsoft hier, und sehen Sie sich die Marke an hier.

Aluminiumoxid