Microsoft używa DeepSpeed, ich biblioteki 1 biliona parametrów AI
2 minuta. czytać
Opublikowany
Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej
Microsoft złożył wniosek o znak towarowy dla DeepSpeed, ich zoptymalizowanej biblioteki AI, która pozwala na szkolenie modeli AI na dużą skalę na skromnym sprzęcie.
Znak towarowy, zgłoszony 8 grudnia 2020 r., odwołuje się do „zapewnienie tymczasowego użytkowania oprogramowania komputerowego online nie do pobrania do przetwarzania sztucznej inteligencji i uczenia głębokiego,” sugerując, że Microsoft może myśleć o udostępnieniu DeepSpeed za pośrednictwem internetowej usługi w chmurze.
DeepSpeed, wydany w lutym tego roku, to biblioteka Pythona, która pozwala na tworzenie modeli głębokiego uczenia o bilionie parametrów, ponad pięciokrotnie więcej niż w obecnym największym modelu na świecie, przy użyciu zaledwie 800 kart graficznych Nvidia V100. Bez DeepSpeed to samo zadanie wymagałoby 4,000 Nvidia A100, które są do 2.5 razy szybsze niż V100, pracując przez 100 dni.
Narzędzie jest szczególnie przydatne po tym, jak GPT-3 wykazał, że modele nadal poprawiają się wraz z większą siecią neuronową i zbiorem danych. Groziło to jednak wypchnięciem najnowszych innowacji poza zasięg mniejszych zespołów dysponujących mniejszymi zasobami, ale DeepSpeed pozwolił tym zespołom konkurować ze znacznie większymi usługami przy minimalnym sprzęcie. Przejście na przetwarzanie w chmurze może sprawić, że szkolenie w zakresie sztucznej inteligencji na dużych modelach będzie jeszcze bardziej dostępne.
Przeczytaj więcej o DeepSpeed w firmie Microsoft tutaji zobacz znak towarowy tutaj.
przez aluminium