Microsoft ja NVIDIA julkistavat suurimman ja tehokkaimman tähän mennessä koulutetun kielimallin

Lukuajan kuvake 1 min. lukea

Kalenterikuvake Julkaistu Lokakuu 11, 2021

Julkaistu Lokakuu 11, 2021

Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta.

Microsoft ja NVIDIA julkistivat tänään DeepSpeed- ja Megatron-käyttöisen Megatron-Turing Natural Language Generation -mallin (MT-NLG), joka on suurin ja tehokkain tähän mennessä koulutettu monoliittinen muuntajakielimalli. Tämä malli sisältää 530 miljardia parametria, 3 kertaa enemmän parametreja verrattuna nykyiseen suurin malliin, GPT-3. Näin suuren mallin kouluttamiseen liittyy erilaisia haasteita. NVIDIA ja Microsoft kehittivät monia innovaatioita ja läpimurtoja kaikilla tekoälyakseleilla.

Esimerkiksi tiiviissä yhteistyössä NVIDIA ja Microsoft saavuttivat ennennäkemättömän koulutustehokkuuden yhdistämällä huippuluokan GPU-kiihdytetyn koulutusinfrastruktuurin huippuluokan hajautetun oppimisohjelmistopinon kanssa. Rakensimme laadukkaita, luonnollisia kieltenharjoittelukorporoita, joissa on satoja miljardeja tokeneita, ja kehitimme yhdessä koulutusreseptejä optimoinnin tehokkuuden ja vakauden parantamiseksi.

Voit oppia lisää tästä projektista alla olevista linkeistä.

Lähde: Microsoft, Nvidia

Lisää aiheista: microsoft, nvidia

Pradeep Viswav

Ohjelmisto- ja palveluasiantuntija

Pradeep on tietojenkäsittelytieteen ja tekniikan tutkinnon suorittanut. Hän oli myös Microsoft Student Partner. Tällä hetkellä hän työskentelee johtavassa IT-yrityksessä.

Jätä vastaus