A Microsoft védjegye a DeepSpeed, az 1 trillió paraméteres AI könyvtáruk

Olvasási idő ikonra 2 perc olvas


Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol. Eszköztipp ikon

Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább

mélysebességű

A Microsoft védjegyet kért a DeepSpeed ​​számára, az optimalizált mesterségesintelligencia-könyvtárukhoz, amely lehetővé teszi nagyméretű mesterséges intelligencia modellek betanítását szerény hardveren.

A 8. december 2020-án bejelentett védjegy hivatkozik a „online, nem letölthető számítógépes szoftverek ideiglenes használatának biztosítása mesterséges intelligencia feldolgozásához és mély tanuláshoz,” arra utal, hogy a Microsoft a DeepSpeed ​​online felhőszolgáltatáson keresztül történő elérhetővé tételén gondolkodik.

Az idén februárban megjelent DeepSpeed ​​egy Python-könyvtár, amely mindössze 800 Nvidia V100 grafikus kártya felhasználásával teszi lehetővé mélytanulási modellek létrehozását billió paraméterrel, több mint ötször annyi, mint a világ jelenlegi legnagyobb modelljében. A DeepSpeed ​​nélkül ugyanehhez a feladathoz 4,000 Nvidia A100-ra lenne szükség, amelyek akár 2.5-szer gyorsabbak, mint a V100, és 100 napig ropognak.

Az eszköz különösen hasznos, miután a GPT-3 kimutatta, hogy a modellek tovább javulnak, minél nagyobb a neurális háló és az adatkészlet. Ez azonban azzal fenyegetett, hogy a legújabb innovációk kiszorulnak a kisebb, kevesebb erőforrással rendelkező csapatok hatóköréből, de a DeepSpeed ​​lehetővé tette, hogy ezek a csapatok sokkal nagyobb szolgáltatásokkal versenyezzenek minimális hardverrel. A felhőfeldolgozásra való áttérés még elérhetőbbé teheti a nagy modellű AI-képzést.

További információ a DeepSpeedről a Microsoftnál itt, és tekintse meg a védjegyet itt.

keresztül Alumia