Microsoft je blagovna znamka DeepSpeed, njihovo 1 trilijon parametrov AI knjižnice

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

globoko hitrost

Microsoft je zaprosil za blagovno znamko za DeepSpeed, njihovo optimizirano knjižnico AI, ki omogoča usposabljanje obsežnih modelov AI na skromni strojni opremi.

Blagovna znamka, vložena 8. decembra 2020, se sklicuje na »zagotavljanje začasne uporabe spletne neprenosljive računalniške programske opreme za obdelavo umetne inteligence in poglobljeno učenje,«, kar kaže, da bi Microsoft morda razmišljal o tem, da bi DeepSpeed ​​omogočil na voljo prek spletne storitve v oblaku.

DeepSpeed, ki je izšla februarja letos, je knjižnica Python, ki omogoča ustvarjanje modelov globokega učenja z bilijono parametrov, kar je več kot petkrat več kot v trenutno največjem modelu na svetu, pri čemer uporablja le 800 grafičnih kartic Nvidia V100. Brez DeepSpeed ​​bi ista naloga zahtevala 4,000 Nvidia A100, ki so do 2.5-krat hitrejši od V100, ki delujejo 100 dni.

Orodje je še posebej uporabno po tem, ko je GPT-3 pokazal, da modeli še naprej izboljšujejo večjo nevronsko mrežo in nabor podatkov. To pa je grozilo, da bo najnovejše inovacije potisnilo iz dosega manjših ekip z manj sredstvi, vendar je DeepSpeed ​​tem ekipam omogočil, da tekmujejo z veliko večjimi storitvami z minimalno strojno opremo. Prehod na obdelavo v oblaku bi lahko naredil usposabljanje velikih modelov umetne inteligence še bolj dostopno.

Preberite več o DeepSpeed ​​pri Microsoftu tukaj, in si oglejte blagovno znamko tukaj.

preko Alumija