Microsoft tavaramerkkinä DeepSpeed, heidän 1 biljoonan parametrin tekoälykirjasto

Lukuajan kuvake 2 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

syvä nopeus

Microsoft on hakenut tavaramerkkiä DeepSpeedille, heidän optimoidulle tekoälykirjastolleen, joka mahdollistaa suurten tekoälymallien koulutuksen vaatimattomalla laitteistolla.

Tavaramerkki, joka on jätetty 8. joulukuuta 2020, viittaa "ei-ladattavien online-tietokoneohjelmistojen tilapäisen käytön tarjoaminen tekoälyn käsittelyyn ja syväoppimiseen,” viittaa siihen, että Microsoft saattaa harkita DeepSpeedin saatavuutta verkkopilvipalvelun kautta.

Tämän vuoden helmikuussa julkaistu DeepSpeed ​​on Python-kirjasto, joka mahdollistaa syväoppimismallien luomisen biljoonalla parametrilla, yli viisi kertaa enemmän kuin maailman nykyisessä suurimmassa mallissa, käyttämällä vain 800 Nvidia V100 -näytönohjainta. Ilman DeepSpeed-toimintoa sama tehtävä vaatisi 4,000 100 Nvidia A2.5:aa, jotka ovat jopa 100 kertaa nopeampia kuin V100, ja ne kestäisivät XNUMX päivää.

Työkalu on erityisen hyödyllinen sen jälkeen, kun GPT-3 osoitti, että mallit paranevat edelleen mitä suurempi on hermoverkko ja tietojoukko. Tämä uhkasi kuitenkin työntää uusimmat innovaatiot pois pienempien, vähemmän resursseja käyttävien tiimien ulottuvilta, mutta DeepSpeed ​​on antanut näille joukkueille mahdollisuuden kilpailla paljon suurempien palveluiden kanssa minimaalisella laitteistolla. Siirtyminen pilvikäsittelyyn voisi tehdä suuren mallin tekoälykoulutuksesta entistä helpompaa.

Lue lisää DeepSpeedistä Microsoftilta tätä, ja katso tavaramerkki tätä.

kautta Alumiini