Microsoft trénoval Phi-3 Mini pouze týden s GPU H100 od Nvidie podporující AI
Mini verze Phi-3 je jediný model, který je v současné době k dispozici
2 min. číst
Publikované dne
Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více
Klíčové poznámky
- Microsoft uvedl na trh modely Phi-3 v čele s Phi-3 Mini s parametry 3.8B,
- Model byl trénován na 3.3 bilionu tokenů za sedm dní pomocí 512 GPU NVIDIA H100.
- Rodina Phi-3 také zahrnuje malé a střední varianty, které překonávají předchozí modely, jako je Phi-2.
Společnost Microsoft spustila Rodina Phi-3 modelů, v současnosti jeden z nejlepších malých modelů na trhu. A teď Nvidia řekl a popsal, jak redmondská společnost používala své GPU H100 k trénování těchto modelů, nebo konkrétněji verze Mini, 3.8B.
„Model má 3.8 miliardy parametrů a byl trénován na 3.3 bilionu tokenů za pouhých sedm dní na 512 GPU NVIDIA H100 Tensor Core,“ uvedl v úterý výrobce.
Rodina Phi-3 přichází se třemi variantami: Phi-3 Mini (3.8B), Phi-3 Small (7B) a Phi-3 Medium (14B). Je to obrovské zlepšení oproti předchozímu Phi-2 který byl spuštěn s pouhými 2.7 miliardami parametrů před měsíci.
Phi-3 Mini, konkrétněji, také přichází se dvěma možnostmi v závislosti na podpůrných tokenech: 4K a 128K. To druhé můžete vyzkoušet v centru AI společnosti Nvidia jako službu Nvidia NIM pro vývojáře a spustit model lokálně pomocí Windows DirectML nebo TensorRT-LLM.
„Modely Phi-3 výrazně převyšují jazykové modely stejné a větší velikosti v klíčových benchmarcích (viz čísla benchmarků níže, vyšší je lepší),“ Microsoft řekl při uvádění modelů se chlubí, že verze Small a Medium mohou překonat větší modely, jako je GPT-3.5T.
Verze Mini je to, co je v tuto chvíli dostupné na trhu, ale Microsoft slíbil, že všechny další dva modely budou brzy dostupné. Můžete také vyzkoušet Phi-3 Mini na Azure AI a Hugging Face.