Microsoft og NVIDIA annoncerer den største og mest kraftfulde sprogmodel, der er trænet til dato

Ikon for læsetid 1 min. Læs

Kalenderikon Udgivet den Oktober 11, 2021

offentliggjort den Oktober 11, 2021

Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links.

Microsoft og NVIDIA annoncerede i dag den DeepSpeed- og Megatron-drevne Megatron-Turing Natural Language Generation-model (MT-NLG), den største og mest kraftfulde monolitiske transformersprogmodel, der er trænet til dato. Denne model inkluderer 530 milliarder parametre, 3x antallet af parametre sammenlignet med den eksisterende største model, GPT-3. Træning af en så stor model indebærer forskellige udfordringer. NVIDIA og Microsoft arbejdede på mange innovationer og gennembrud langs alle AI-akser.

For eksempel, i tæt samarbejde, opnåede NVIDIA og Microsoft en hidtil uset træningseffektivitet ved at konvergere en avanceret GPU-accelereret træningsinfrastruktur med en banebrydende distribueret læringssoftwarestak. Vi byggede højkvalitets, naturligt sprogtræningskorpus med hundredvis af milliarder af tokens og co-udviklede træningsopskrifter for at forbedre optimeringseffektiviteten og stabiliteten.

Du kan lære mere om dette projekt fra nedenstående links.

Kilde: microsoft, Nvidia

Mere om emnerne: microsoft, nvidia

Pradeep Viswav

Software- og serviceekspert

Pradeep er uddannet datalogi og ingeniør. Han var også Microsoft Student Partner. Han arbejder i øjeblikket i en førende it-virksomhed.

Giv en kommentar