Microsoft handelsmerken DeepSpeed, hun 1 Trillion Parameters AI-bibliotheek

Pictogram voor leestijd 2 minuut. lezen


Lezers helpen MSpoweruser ondersteunen. We kunnen een commissie krijgen als u via onze links koopt. Tooltip-pictogram

Lees onze openbaarmakingspagina om erachter te komen hoe u MSPoweruser kunt helpen het redactieteam te ondersteunen Lees meer

diepe snelheid

Microsoft heeft een handelsmerk aangevraagd voor DeepSpeed, hun geoptimaliseerde AI-bibliotheek waarmee grootschalige AI-modellen op bescheiden hardware kunnen worden getraind.

Het handelsmerk, gedeponeerd op 8 december 2020, verwijst naar “verschaffing van tijdelijk gebruik van niet-downloadbare onlinecomputersoftware voor de verwerking van kunstmatige intelligentie en deep learning,” suggereert dat Microsoft overweegt om DeepSpeed ​​beschikbaar te maken via een online cloudservice.

DeepSpeed, uitgebracht in februari van dit jaar, is een Python-bibliotheek die het mogelijk maakt om deep learning-modellen te creëren met een biljoen parameters, meer dan vijf keer zoveel als in 's werelds huidige grootste model, met slechts 800 Nvidia V100 grafische kaarten. Zonder DeepSpeed ​​zou voor dezelfde taak 4,000 Nvidia A100's nodig zijn, die tot 2.5 keer sneller zijn dan de V100, die 100 dagen draaien.

De tool is vooral handig nadat GPT-3 heeft aangetoond dat modellen blijven verbeteren naarmate het neurale netwerk en de dataset groter worden. Dit dreigde echter de nieuwste innovaties buiten het bereik van kleinere teams met minder middelen te duwen, maar DeepSpeed ​​heeft deze teams in staat gesteld om te concurreren met veel grotere services met minimale hardware. Een overstap naar cloudverwerking zou AI-trainingen voor grote modellen nog toegankelijker kunnen maken.

Lees meer over DeepSpeed ​​bij Microsoft hier, en zie het handelsmerk hier.

via Alumia