Microsoft og NVIDIA kunngjør den største og kraftigste språkmodellen som er trent til dags dato

Ikon for lesetid 1 min. lese


Lesere hjelper til med å støtte MSpoweruser. Vi kan få provisjon hvis du kjøper gjennom lenkene våre. Verktøytipsikon

Les vår avsløringsside for å finne ut hvordan du kan hjelpe MSPoweruser opprettholde redaksjonen Les mer

Microsoft NVIDIA

Microsoft NVIDIA

Microsoft og NVIDIA kunngjorde i dag den DeepSpeed- og Megatron-drevne Megatron-Turing Natural Language Generation-modellen (MT-NLG), den største og kraftigste monolitiske transformatorspråkmodellen som er trent til dags dato. Denne modellen inkluderer 530 milliarder parametere, 3 ganger antall parametere sammenlignet med den eksisterende største modellen, GPT-3. Trening av en så stor modell innebærer ulike utfordringer. NVIDIA og Microsoft jobbet med mange innovasjoner og gjennombrudd langs alle AI-akser.

For eksempel, i tett samarbeid, oppnådde NVIDIA og Microsoft en enestående treningseffektivitet ved å konvergere en toppmoderne GPU-akselerert treningsinfrastruktur med en banebrytende distribuert læringsprogramvarestabel. Vi bygde høykvalitets, naturlig språkopplæringskorpora med hundrevis av milliarder av tokens, og samutviklede treningsoppskrifter for å forbedre optimaliseringseffektiviteten og stabiliteten.

Du kan lære mer om dette prosjektet fra lenkene nedenfor.

kilde: Microsoft, Nvidia

Mer om temaene: microsoft, nvidia

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket *