A Microsoft védjegye a DeepSpeed, az 1 trillió paraméteres AI könyvtáruk
2 perc olvas
Publikálva
Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább
A Microsoft védjegyet kért a DeepSpeed számára, az optimalizált mesterségesintelligencia-könyvtárukhoz, amely lehetővé teszi nagyméretű mesterséges intelligencia modellek betanítását szerény hardveren.
A 8. december 2020-án bejelentett védjegy hivatkozik a „online, nem letölthető számítógépes szoftverek ideiglenes használatának biztosítása mesterséges intelligencia feldolgozásához és mély tanuláshoz,” arra utal, hogy a Microsoft a DeepSpeed online felhőszolgáltatáson keresztül történő elérhetővé tételén gondolkodik.
Az idén februárban megjelent DeepSpeed egy Python-könyvtár, amely mindössze 800 Nvidia V100 grafikus kártya felhasználásával teszi lehetővé mélytanulási modellek létrehozását billió paraméterrel, több mint ötször annyi, mint a világ jelenlegi legnagyobb modelljében. A DeepSpeed nélkül ugyanehhez a feladathoz 4,000 Nvidia A100-ra lenne szükség, amelyek akár 2.5-szer gyorsabbak, mint a V100, és 100 napig ropognak.
Az eszköz különösen hasznos, miután a GPT-3 kimutatta, hogy a modellek tovább javulnak, minél nagyobb a neurális háló és az adatkészlet. Ez azonban azzal fenyegetett, hogy a legújabb innovációk kiszorulnak a kisebb, kevesebb erőforrással rendelkező csapatok hatóköréből, de a DeepSpeed lehetővé tette, hogy ezek a csapatok sokkal nagyobb szolgáltatásokkal versenyezzenek minimális hardverrel. A felhőfeldolgozásra való áttérés még elérhetőbbé teheti a nagy modellű AI-képzést.
További információ a DeepSpeedről a Microsoftnál itt, és tekintse meg a védjegyet itt.
keresztül Alumia