Microsoft og NVIDIA kunngjør den største og kraftigste språkmodellen som er trent til dags dato

Ikon for lesetid 1 min. lese

Kalenderikon Publisert på Oktober 11, 2021

publisert på Oktober 11, 2021

Lesere hjelper til med å støtte MSpoweruser. Vi kan få provisjon hvis du kjøper gjennom lenkene våre.

Microsoft og NVIDIA kunngjorde i dag den DeepSpeed- og Megatron-drevne Megatron-Turing Natural Language Generation-modellen (MT-NLG), den største og kraftigste monolitiske transformatorspråkmodellen som er trent til dags dato. Denne modellen inkluderer 530 milliarder parametere, 3 ganger antall parametere sammenlignet med den eksisterende største modellen, GPT-3. Trening av en så stor modell innebærer ulike utfordringer. NVIDIA og Microsoft jobbet med mange innovasjoner og gjennombrudd langs alle AI-akser.

For eksempel, i tett samarbeid, oppnådde NVIDIA og Microsoft en enestående treningseffektivitet ved å konvergere en toppmoderne GPU-akselerert treningsinfrastruktur med en banebrytende distribuert læringsprogramvarestabel. Vi bygde høykvalitets, naturlig språkopplæringskorpora med hundrevis av milliarder av tokens, og samutviklede treningsoppskrifter for å forbedre optimaliseringseffektiviteten og stabiliteten.

Du kan lære mer om dette prosjektet fra lenkene nedenfor.

kilde: Microsoft, Nvidia

Mer om temaene: microsoft, nvidia

Pradeep Viswav

Ekspert på programvare og tjenester

Pradeep er utdannet informatikk og ingeniør. Han var også en Microsoft Student Partner. Han jobber for tiden i et ledende IT-selskap.

Legg igjen en kommentar