Microsoft używa DeepSpeed, ich biblioteki 1 biliona parametrów AI

Ikona czasu czytania 2 minuta. czytać


Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków. Ikona podpowiedzi

Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej

głęboka prędkość

Microsoft złożył wniosek o znak towarowy dla DeepSpeed, ich zoptymalizowanej biblioteki AI, która pozwala na szkolenie modeli AI na dużą skalę na skromnym sprzęcie.

Znak towarowy, zgłoszony 8 grudnia 2020 r., odwołuje się do „zapewnienie tymczasowego użytkowania oprogramowania komputerowego online nie do pobrania do przetwarzania sztucznej inteligencji i uczenia głębokiego,” sugerując, że Microsoft może myśleć o udostępnieniu DeepSpeed ​​za pośrednictwem internetowej usługi w chmurze.

DeepSpeed, wydany w lutym tego roku, to biblioteka Pythona, która pozwala na tworzenie modeli głębokiego uczenia o bilionie parametrów, ponad pięciokrotnie więcej niż w obecnym największym modelu na świecie, przy użyciu zaledwie 800 kart graficznych Nvidia V100. Bez DeepSpeed ​​to samo zadanie wymagałoby 4,000 Nvidia A100, które są do 2.5 razy szybsze niż V100, pracując przez 100 dni.

Narzędzie jest szczególnie przydatne po tym, jak GPT-3 wykazał, że modele nadal poprawiają się wraz z większą siecią neuronową i zbiorem danych. Groziło to jednak wypchnięciem najnowszych innowacji poza zasięg mniejszych zespołów dysponujących mniejszymi zasobami, ale DeepSpeed ​​pozwolił tym zespołom konkurować ze znacznie większymi usługami przy minimalnym sprzęcie. Przejście na przetwarzanie w chmurze może sprawić, że szkolenie w zakresie sztucznej inteligencji na dużych modelach będzie jeszcze bardziej dostępne.

Przeczytaj więcej o DeepSpeed ​​w firmie Microsoft tutaji zobacz znak towarowy tutaj.

przez aluminium