Microsoft tavaramerkkinä DeepSpeed, heidän 1 biljoonan parametrin tekoälykirjasto
2 min. lukea
Julkaistu
Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää
Microsoft on hakenut tavaramerkkiä DeepSpeedille, heidän optimoidulle tekoälykirjastolleen, joka mahdollistaa suurten tekoälymallien koulutuksen vaatimattomalla laitteistolla.
Tavaramerkki, joka on jätetty 8. joulukuuta 2020, viittaa "ei-ladattavien online-tietokoneohjelmistojen tilapäisen käytön tarjoaminen tekoälyn käsittelyyn ja syväoppimiseen,” viittaa siihen, että Microsoft saattaa harkita DeepSpeedin saatavuutta verkkopilvipalvelun kautta.
Tämän vuoden helmikuussa julkaistu DeepSpeed on Python-kirjasto, joka mahdollistaa syväoppimismallien luomisen biljoonalla parametrilla, yli viisi kertaa enemmän kuin maailman nykyisessä suurimmassa mallissa, käyttämällä vain 800 Nvidia V100 -näytönohjainta. Ilman DeepSpeed-toimintoa sama tehtävä vaatisi 4,000 100 Nvidia A2.5:aa, jotka ovat jopa 100 kertaa nopeampia kuin V100, ja ne kestäisivät XNUMX päivää.
Työkalu on erityisen hyödyllinen sen jälkeen, kun GPT-3 osoitti, että mallit paranevat edelleen mitä suurempi on hermoverkko ja tietojoukko. Tämä uhkasi kuitenkin työntää uusimmat innovaatiot pois pienempien, vähemmän resursseja käyttävien tiimien ulottuvilta, mutta DeepSpeed on antanut näille joukkueille mahdollisuuden kilpailla paljon suurempien palveluiden kanssa minimaalisella laitteistolla. Siirtyminen pilvikäsittelyyn voisi tehdä suuren mallin tekoälykoulutuksesta entistä helpompaa.
Lue lisää DeepSpeedistä Microsoftilta tätä, ja katso tavaramerkki tätä.
kautta Alumiini