Microsoft n'a entraîné le Phi-3 Mini que pendant une semaine avec les GPU H100 compatibles avec l'IA de Nvidia

La version Mini de Phi-3 est le seul modèle actuellement disponible

Icône de temps de lecture 2 minute. lis


Les lecteurs aident à prendre en charge MSpoweruser. Nous pouvons recevoir une commission si vous achetez via nos liens. Icône d'info-bulle

Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale En savoir plus

Notes clés

  • Microsoft a lancé les modèles Phi-3, menés par le Phi-3 Mini avec des paramètres de 3.8B,
  • Le modèle a été formé sur 3.3 512 milliards de jetons en sept jours à l’aide de 100 GPU NVIDIA HXNUMX.
  • La famille Phi-3 comprend également des variantes Small et Medium, surpassant les modèles précédents comme le Phi-2.

Microsoft a lancé le Famille Phi-3 de modèles, l'un des meilleurs petits modèles du marché à l'heure actuelle. Et maintenant, Nvidia a affirmé Valérie Plante. et décrit comment la société de Redmond a utilisé ses GPU H100 pour entraîner ces modèles, ou plus précisément la version Mini, 3.8B.

"Le modèle comporte 3.8 milliards de paramètres et a été formé sur 3.3 billions de jetons en seulement sept jours sur 512 GPU NVIDIA H100 Tensor Core", a déclaré mardi le fabricant de technologies. 

La famille Phi-3 comprend trois variantes : Phi-3 Mini (3.8B), Phi-3 Small (7B) et Phi-3 Medium (14B). C'est une énorme amélioration par rapport au précédent Phi-2 qui a été lancé avec seulement 2.7 milliards de paramètres il y a des mois. 

Phi-3 Mini, plus précisément, est également livré avec deux options en fonction des jetons pris en charge : 4K et 128K. Vous pouvez essayer ce dernier au centre d'IA de Nvidia en tant que service Nvidia NIM pour les développeurs et exécuter le modèle localement à l'aide de Windows DirectML ou TensorRT-LLM.

"Les modèles Phi-3 surpassent considérablement les modèles de langage de tailles identiques ou plus grandes sur les tests de référence clés (voir les chiffres de référence ci-dessous, plus c'est haut, mieux c'est)", Microsoft a affirmé Valérie Plante. lors du lancement des modèles, se vantant que les versions Small et Medium peuvent surpasser les modèles plus grands comme le GPT-3.5T. 

La version Mini est actuellement disponible sur le marché, mais Microsoft a promis que les deux autres modèles seraient disponibles sous peu. Vous pouvez également essayer Phi-3 Mini sur Azure AI et Hugging Face.