Microsoft a antrenat Phi-3 Mini doar pentru o săptămână cu GPU-urile Nvidia H100 prietenoase cu AI

Versiunea Mini a lui Phi-3 este singurul model disponibil în prezent

Pictograma timp de citire 2 min. citit


Cititorii ajută la sprijinirea MSpoweruser. Este posibil să primim un comision dacă cumpărați prin link-urile noastre. Pictograma Tooltip

Citiți pagina noastră de dezvăluire pentru a afla cum puteți ajuta MSPoweruser să susțină echipa editorială Află mai multe

Note cheie

  • Microsoft a lansat modele Phi-3, conduse de Phi-3 Mini cu parametri 3.8B,
  • Modelul a fost antrenat pe 3.3 trilioane de jetoane în șapte zile folosind 512 GPU-uri NVIDIA H100.
  • Familia Phi-3 include și variante Small și Medium, depășind modelele anterioare precum Phi-2.

Microsoft a lansat Familia Phi-3 de modele, unul dintre cele mai bune modele mici de pe piață în acest moment. Și acum, Nvidia a spus și a descris modul în care compania Redmond și-a folosit GPU-urile H100 pentru a antrena aceste modele, sau mai precis, versiunea Mini, 3.8B.

„Modelul are 3.8 miliarde de parametri și a fost antrenat pe 3.3 trilioane de jetoane în doar șapte zile pe 512 GPU-uri NVIDIA H100 Tensor Core”, spune marți producătorul de tehnologie. 

Familia Phi-3 vine cu trei variante: Phi-3 Mini (3.8B), Phi-3 Small (7B) și Phi-3 Medium (14B). Este o îmbunătățire masivă față de precedentul Phi-2 care a fost lansat cu doar 2.7 miliarde de parametri în urmă cu luni. 

Phi-3 Mini, mai precis, vine și cu două opțiuni, în funcție de token-urile compatibile: 4K și 128K. Puteți încerca pe acesta din urmă la centrul AI al Nvidia ca serviciu Nvidia NIM pentru dezvoltatori și să rulați modelul local folosind Windows DirectML sau TensorRT-LLM.

„Modelele Phi-3 depășesc semnificativ modelele lingvistice de aceleași dimensiuni și mai mari în ceea ce privește reperele cheie (vezi numerele de referință de mai jos, mai mare este mai bine)” Microsoft a spus la lansarea modelelor, lăudându-se că versiunile Small și Medium pot depăși modelele mai mari precum GPT-3.5T. 

Versiunea Mini este cea care este disponibilă pe piață în acest moment, dar Microsoft a promis că toate celelalte două modele vor fi disponibile în curând. Puteți încerca și Phi-3 Mini pe Azure AI și Hugging Face.