Microsoft varemerker DeepSpeed, deres 1 Trillion Parameters AI-bibliotek

Ikon for lesetid 2 min. lese


Lesere hjelper til med å støtte MSpoweruser. Vi kan få provisjon hvis du kjøper gjennom lenkene våre. Verktøytipsikon

Les vår avsløringsside for å finne ut hvordan du kan hjelpe MSPoweruser opprettholde redaksjonen Les mer

dyphastighet

Microsoft har søkt om et varemerke for DeepSpeed, deres optimaliserte AI-bibliotek som gir mulighet for opplæring av store AI-modeller på beskjeden maskinvare.

Varemerket, arkivert 8. desember 2020, viser til "tilby midlertidig bruk av nettbasert, ikke-nedlastbar dataprogramvare for kunstig intelligensbehandling og dyp læring,” antyder at Microsoft kanskje tenker på å gjøre DeepSpeed ​​tilgjengelig via en nettskytjeneste.

DeepSpeed, utgitt i februar i år, er et Python-bibliotek som gjør det mulig å lage dyplæringsmodeller med en billion parametere, mer enn fem ganger så mange som i verdens nåværende største modell, med kun 800 Nvidia V100-grafikkort. Uten DeepSpeed ​​ville den samme oppgaven kreve 4,000 Nvidia A100-er, som er opptil 2.5 ganger raskere enn V100, og knaser i 100 dager.

Verktøyet er spesielt nyttig etter at GPT-3 viste at modeller fortsetter å forbedre jo større nevrale nettet og datasettet er. Dette truet imidlertid med å presse de siste innovasjonene utenfor rekkevidden til mindre team med færre ressurser, men DeepSpeed ​​har tillatt disse teamene å konkurrere med mye større tjenester med minimal maskinvare. En overgang til skybehandling kan gjøre opplæring i store modeller av AI enda mer tilgjengelig.

Les mer om DeepSpeed ​​hos Microsoft her., og se varemerket her..

av Aluminium