Microsoft et NVIDIA annoncent le plus grand et le plus puissant modèle de langage formé à ce jour

Icône de temps de lecture 1 minute. lis

Icône de calendrier Publié le 11 octobre 2021

publié sur 11 octobre 2021

Les lecteurs aident à prendre en charge MSpoweruser. Nous pouvons recevoir une commission si vous achetez via nos liens.

Microsoft et NVIDIA ont annoncé aujourd'hui le modèle de génération de langage naturel Megatron-Turing (MT-NLG) alimenté par DeepSpeed et Megatron, le plus grand et le plus puissant modèle de langage de transformateur monolithique formé à ce jour. Ce modèle comprend 530 milliards de paramètres, soit 3 fois le nombre de paramètres par rapport au plus grand modèle existant, GPT-3. La formation d'un si grand modèle implique divers défis. NVIDIA et Microsoft ont travaillé sur de nombreuses innovations et percées sur tous les axes de l'IA.

Par exemple, en travaillant en étroite collaboration, NVIDIA et Microsoft ont atteint une efficacité de formation sans précédent en faisant converger une infrastructure de formation accélérée par GPU à la pointe de la technologie avec une pile logicielle d'apprentissage distribué de pointe. Nous avons construit des corpus de formation en langage naturel de haute qualité avec des centaines de milliards de jetons, et co-développé des recettes de formation pour améliorer l'efficacité et la stabilité de l'optimisation.

Vous pouvez en savoir plus sur ce projet à partir des liens ci-dessous.

La source: Microsoft, Nvidia

En savoir plus sur les sujets : microsoft, nvidia

Pradeep Viswav

Expert en logiciels et services

Pradeep est diplômé en informatique et en ingénierie. Il était également partenaire étudiant Microsoft. Il travaille actuellement dans une entreprise informatique leader.

Soyez sympa! Laissez un commentaire