Microsoft zaštitni znakovi DeepSpeed, njihovu 1 trilijun parametara AI biblioteku

Ikona vremena čitanja 2 min. čitati


Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza. Ikona opisa alata

Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više

duboka brzina

Microsoft je podnio zahtjev za zaštitni znak za DeepSpeed, njihovu optimiziranu AI biblioteku koja omogućuje obuku velikih AI modela na skromnom hardveru.

Zaštitni znak, zaveden 8. prosinca 2020., upućuje na “pružanje privremenog korištenja internetskog računalnog softvera koji se ne može preuzeti za obradu umjetne inteligencije i duboko učenje,” što sugerira da Microsoft možda razmišlja o tome da DeepSpeed ​​učini dostupnim putem internetske usluge u oblaku.

DeepSpeed, objavljen u veljači ove godine, je Python biblioteka koja omogućuje stvaranje modela dubokog učenja s trilijunom parametara, više od pet puta više od trenutno najvećeg modela na svijetu, koristeći samo 800 Nvidia V100 grafičkih kartica. Bez DeepSpeeda, za isti zadatak bi bilo potrebno 4,000 Nvidia A100, koji su do 2.5 puta brži od V100, koji rade 100 dana.

Alat je osobito koristan nakon što je GPT-3 pokazao da modeli nastavljaju poboljšavati što je veća neuronska mreža i skup podataka. To je, međutim, zaprijetilo gurnuti najnovije inovacije izvan dosega manjih timova s ​​manje resursa, ali DeepSpeed ​​je omogućio tim timovima da se natječu s mnogo većim uslugama s minimalnim hardverom. Prelazak na obradu u oblaku mogao bi učiniti obuku velikih modela umjetne inteligencije još dostupnijom.

Pročitajte više o DeepSpeedu u Microsoftu ovdje, i pogledajte zaštitni znak ovdje.

preko Glumica