Microsoft ja NVIDIA julkistavat suurimman ja tehokkaimman tähän mennessä koulutetun kielimallin

Lukuajan kuvake 1 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Microsoft NVIDIA

Microsoft NVIDIA

Microsoft ja NVIDIA julkistivat tänään DeepSpeed- ja Megatron-käyttöisen Megatron-Turing Natural Language Generation -mallin (MT-NLG), joka on suurin ja tehokkain tähän mennessä koulutettu monoliittinen muuntajakielimalli. Tämä malli sisältää 530 miljardia parametria, 3 kertaa enemmän parametreja verrattuna nykyiseen suurin malliin, GPT-3. Näin suuren mallin kouluttamiseen liittyy erilaisia ​​haasteita. NVIDIA ja Microsoft kehittivät monia innovaatioita ja läpimurtoja kaikilla tekoälyakseleilla.

Esimerkiksi tiiviissä yhteistyössä NVIDIA ja Microsoft saavuttivat ennennäkemättömän koulutustehokkuuden yhdistämällä huippuluokan GPU-kiihdytetyn koulutusinfrastruktuurin huippuluokan hajautetun oppimisohjelmistopinon kanssa. Rakensimme laadukkaita, luonnollisia kieltenharjoittelukorporoita, joissa on satoja miljardeja tokeneita, ja kehitimme yhdessä koulutusreseptejä optimoinnin tehokkuuden ja vakauden parantamiseksi.

Voit oppia lisää tästä projektista alla olevista linkeistä.

Lähde: Microsoft, Nvidia

Lisää aiheista: microsoft, nvidia

Jätä vastaus

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *