Microsoft varemerker DeepSpeed, deres 1 Trillion Parameters AI-bibliotek
2 min. lese
Publisert på
Les vår avsløringsside for å finne ut hvordan du kan hjelpe MSPoweruser opprettholde redaksjonen Les mer
Microsoft har søkt om et varemerke for DeepSpeed, deres optimaliserte AI-bibliotek som gir mulighet for opplæring av store AI-modeller på beskjeden maskinvare.
Varemerket, arkivert 8. desember 2020, viser til "tilby midlertidig bruk av nettbasert, ikke-nedlastbar dataprogramvare for kunstig intelligensbehandling og dyp læring,” antyder at Microsoft kanskje tenker på å gjøre DeepSpeed tilgjengelig via en nettskytjeneste.
DeepSpeed, utgitt i februar i år, er et Python-bibliotek som gjør det mulig å lage dyplæringsmodeller med en billion parametere, mer enn fem ganger så mange som i verdens nåværende største modell, med kun 800 Nvidia V100-grafikkort. Uten DeepSpeed ville den samme oppgaven kreve 4,000 Nvidia A100-er, som er opptil 2.5 ganger raskere enn V100, og knaser i 100 dager.
Verktøyet er spesielt nyttig etter at GPT-3 viste at modeller fortsetter å forbedre jo større nevrale nettet og datasettet er. Dette truet imidlertid med å presse de siste innovasjonene utenfor rekkevidden til mindre team med færre ressurser, men DeepSpeed har tillatt disse teamene å konkurrere med mye større tjenester med minimal maskinvare. En overgang til skybehandling kan gjøre opplæring i store modeller av AI enda mer tilgjengelig.
Les mer om DeepSpeed hos Microsoft her., og se varemerket her..
av Aluminium