A Microsoft és az NVIDIA bejelentette az eddigi legnagyobb és legerősebb nyelvi modellt

Olvasási idő ikonra 1 perc olvas

Naptár ikonra Publikálva Október 11, 2021

közzétették Október 11, 2021

Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol.

A Microsoft és az NVIDIA ma bejelentette a DeepSpeed- és Megatron-meghajtású Megatron-Turing Natural Language Generation modellt (MT-NLG), amely a legnagyobb és legerősebb monolit transzformátor nyelvi modell, amelyet eddig betanítottak. Ez a modell 530 milliárd paramétert tartalmaz, háromszor annyi paramétert, mint a jelenlegi legnagyobb modell, a GPT-3. Egy ilyen nagy modell képzése különféle kihívásokkal jár. Az NVIDIA és a Microsoft számos újításon és áttörésen dolgozott az AI minden tengelyén.

Például szoros együttműködésben az NVIDIA és a Microsoft példátlan képzési hatékonyságot ért el a legmodernebb GPU-gyorsítású képzési infrastruktúra és a legmodernebb elosztott tanulási szoftverkészlet konvergálásával. Kiváló minőségű, természetes nyelvoktató korpuszokat építettünk több százmilliárd tokennel, és közösen fejlesztettünk képzési recepteket az optimalizálás hatékonyságának és stabilitásának javítása érdekében.

Erről a projektről többet megtudhat az alábbi linkeken.

Forrás: microsoft, Nvidia

Bővebben a témákról: microsoft, nvidia

Pradeep Viswav

Szoftver- és szolgáltatásszakértő

Pradeep számítástechnikai és mérnöki végzettségű. A Microsoft diákpartnere is volt. Jelenleg egy vezető informatikai cégnél dolgozik.

Hagy egy Válaszol