Microsoft varemærker DeepSpeed, deres 1 Trillion Parameters AI-bibliotek

Ikon for læsetid 2 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

dyb hastighed

Microsoft har ansøgt om et varemærke for DeepSpeed, deres optimerede AI-bibliotek, som giver mulighed for træning af store AI-modeller på beskeden hardware.

Varemærket, indleveret den 8. december 2020, henviser til "udbydelse af midlertidig brug af online computersoftware, der ikke kan downloades, til behandling af kunstig intelligens og dyb læring,”, hvilket tyder på, at Microsoft måske overvejer at gøre DeepSpeed ​​tilgængelig via en online cloud-tjeneste.

DeepSpeed, der blev udgivet i februar i år, er et Python-bibliotek, der giver mulighed for at skabe deep learning-modeller med en billion parametre, mere end fem gange så mange som i verdens nuværende største model, ved kun at bruge 800 Nvidia V100-grafikkort. Uden DeepSpeed ​​ville den samme opgave kræve 4,000 Nvidia A100'er, som er op til 2.5 gange hurtigere end V100, og knaser i 100 dage.

Værktøjet er særligt nyttigt, efter at GPT-3 viste, at modeller fortsætter med at forbedre, jo større det neurale net og datasæt er. Dette truede dog med at skubbe de seneste innovationer uden for rækkevidde af mindre teams med færre ressourcer, men DeepSpeed ​​har givet disse teams mulighed for at konkurrere med meget større tjenester med minimal hardware. Et skift til cloud-behandling kan gøre AI-træning i store modeller endnu mere tilgængelig.

Læs mere om DeepSpeed ​​hos Microsoft link., og se varemærket link..

via Alumia