Microsoft trénoval Phi-3 Mini pouze týden s GPU H100 od Nvidie podporující AI

Mini verze Phi-3 je jediný model, který je v současné době k dispozici

Ikona času čtení 2 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více

Klíčové poznámky

  • Microsoft uvedl na trh modely Phi-3 v čele s Phi-3 Mini s parametry 3.8B,
  • Model byl trénován na 3.3 bilionu tokenů za sedm dní pomocí 512 GPU NVIDIA H100.
  • Rodina Phi-3 také zahrnuje malé a střední varianty, které překonávají předchozí modely, jako je Phi-2.

Společnost Microsoft spustila Rodina Phi-3 modelů, v současnosti jeden z nejlepších malých modelů na trhu. A teď Nvidia řekl a popsal, jak redmondská společnost používala své GPU H100 k trénování těchto modelů, nebo konkrétněji verze Mini, 3.8B.

„Model má 3.8 miliardy parametrů a byl trénován na 3.3 bilionu tokenů za pouhých sedm dní na 512 GPU NVIDIA H100 Tensor Core,“ uvedl v úterý výrobce. 

Rodina Phi-3 přichází se třemi variantami: Phi-3 Mini (3.8B), Phi-3 Small (7B) a Phi-3 Medium (14B). Je to obrovské zlepšení oproti předchozímu Phi-2 který byl spuštěn s pouhými 2.7 miliardami parametrů před měsíci. 

Phi-3 Mini, konkrétněji, také přichází se dvěma možnostmi v závislosti na podpůrných tokenech: 4K a 128K. To druhé můžete vyzkoušet v centru AI společnosti Nvidia jako službu Nvidia NIM pro vývojáře a spustit model lokálně pomocí Windows DirectML nebo TensorRT-LLM.

„Modely Phi-3 výrazně převyšují jazykové modely stejné a větší velikosti v klíčových benchmarcích (viz čísla benchmarků níže, vyšší je lepší),“ Microsoft řekl při uvádění modelů se chlubí, že verze Small a Medium mohou překonat větší modely, jako je GPT-3.5T. 

Verze Mini je to, co je v tuto chvíli dostupné na trhu, ale Microsoft slíbil, že všechny další dva modely budou brzy dostupné. Můžete také vyzkoušet Phi-3 Mini na Azure AI a Hugging Face.