Microsofts varumärken DeepSpeed, deras 1 biljoner parametrar AI-bibliotek

Lästid ikon 2 min. läsa


Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar. Verktygstipsikon

Läs vår informationssida för att ta reda på hur du kan hjälpa MSPoweruser upprätthålla redaktionen Läs mer

djuphastighet

Microsoft har ansökt om ett varumärke för DeepSpeed, deras optimerade AI-bibliotek som möjliggör utbildning av storskaliga AI-modeller på blygsam hårdvara.

Varumärket, inlämnat den 8 december 2020, hänvisar till "tillhandahållande av tillfällig användning av icke-nedladdningsbar datorprogramvara online för bearbetning av artificiell intelligens och djupinlärning,” vilket tyder på att Microsoft kanske funderar på att göra DeepSpeed ​​tillgängligt via en molntjänst online.

DeepSpeed, som släpptes i februari i år, är ett Python-bibliotek som möjliggör skapandet av djupinlärningsmodeller med en biljon parametrar, mer än fem gånger så många som i världens nuvarande största modell, med endast 800 Nvidia V100-grafikkort. Utan DeepSpeed ​​skulle samma uppgift kräva 4,000 100 Nvidia A2.5, som är upp till 100 gånger snabbare än V100, och knakar i XNUMX dagar.

Verktyget är särskilt användbart efter att GPT-3 visade att modellerna fortsätter att förbättras ju större neurala nätet och datauppsättningen är. Detta hotade dock att pressa de senaste innovationerna utom räckhåll för mindre team med färre resurser, men DeepSpeed ​​har tillåtit dessa team att konkurrera med mycket större tjänster med minimal hårdvara. En övergång till molnbearbetning skulle kunna göra utbildning i stora modeller av AI ännu mer tillgänglig.

Läs mer om DeepSpeed ​​hos Microsoft här., och se varumärket här..

via Alumia