Microsoft n'a entraîné le Phi-3 Mini que pendant une semaine avec les GPU H100 compatibles avec l'IA de Nvidia
La version Mini de Phi-3 est le seul modèle actuellement disponible
2 minute. lis
Publié le
Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale En savoir plus
Notes clés
- Microsoft a lancé les modèles Phi-3, menés par le Phi-3 Mini avec des paramètres de 3.8B,
- Le modèle a été formé sur 3.3 512 milliards de jetons en sept jours à l’aide de 100 GPU NVIDIA HXNUMX.
- La famille Phi-3 comprend également des variantes Small et Medium, surpassant les modèles précédents comme le Phi-2.
Microsoft a lancé le Famille Phi-3 de modèles, l'un des meilleurs petits modèles du marché à l'heure actuelle. Et maintenant, Nvidia a affirmé Valérie Plante. et décrit comment la société de Redmond a utilisé ses GPU H100 pour entraîner ces modèles, ou plus précisément la version Mini, 3.8B.
"Le modèle comporte 3.8 milliards de paramètres et a été formé sur 3.3 billions de jetons en seulement sept jours sur 512 GPU NVIDIA H100 Tensor Core", a déclaré mardi le fabricant de technologies.
La famille Phi-3 comprend trois variantes : Phi-3 Mini (3.8B), Phi-3 Small (7B) et Phi-3 Medium (14B). C'est une énorme amélioration par rapport au précédent Phi-2 qui a été lancé avec seulement 2.7 milliards de paramètres il y a des mois.
Phi-3 Mini, plus précisément, est également livré avec deux options en fonction des jetons pris en charge : 4K et 128K. Vous pouvez essayer ce dernier au centre d'IA de Nvidia en tant que service Nvidia NIM pour les développeurs et exécuter le modèle localement à l'aide de Windows DirectML ou TensorRT-LLM.
"Les modèles Phi-3 surpassent considérablement les modèles de langage de tailles identiques ou plus grandes sur les tests de référence clés (voir les chiffres de référence ci-dessous, plus c'est haut, mieux c'est)", Microsoft a affirmé Valérie Plante. lors du lancement des modèles, se vantant que les versions Small et Medium peuvent surpasser les modèles plus grands comme le GPT-3.5T.
La version Mini est actuellement disponible sur le marché, mais Microsoft a promis que les deux autres modèles seraient disponibles sous peu. Vous pouvez également essayer Phi-3 Mini sur Azure AI et Hugging Face.