Microsoft je trenirao Phi-3 Mini samo tjedan dana s Nvidijinim H100 GPU-ima prilagođenim umjetnoj inteligenciji
Mini verzija Phi-3 je jedini model koji je trenutno dostupan
2 min. čitati
Objavljeno na
Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više
Ključne napomene
- Microsoft je lansirao modele Phi-3, predvođene Phi-3 Mini s parametrima od 3.8B,
- Model je treniran na 3.3 trilijuna tokena u sedam dana koristeći 512 NVIDIA H100 GPU-a.
- Obitelj Phi-3 također uključuje male i srednje varijante, nadmašujući prethodne modele poput Phi-2.
Microsoft je pokrenuo Phi-3 obitelj modela, jedan od trenutno najboljih malih modela na tržištu. A sada, Nvidia , rekao je i opisao kako je tvrtka iz Redmonda koristila svoje H100 GPU-ove za treniranje ovih modela, točnije Mini, 3.8B verzije.
"Model ima 3.8 milijardi parametara i obučen je na 3.3 trilijuna tokena u samo sedam dana na 512 NVIDIA H100 Tensor Core GPU-ova", rekao je tehnološki proizvođač u utorak.
Obitelj Phi-3 dolazi s tri varijante: Phi-3 Mini (3.8B), Phi-3 Small (7B) i Phi-3 Medium (14B). To je veliko poboljšanje u odnosu na prethodni Phi-2 koji je pokrenut sa samo 2.7B parametara prije nekoliko mjeseci.
Phi-3 Mini, točnije, također dolazi s dvije opcije ovisno o podržanim tokenima: 4K i 128K. Potonje možete isprobati u Nvidijinom AI centru kao Nvidia NIM uslugu za programere i pokrenuti model lokalno koristeći Windows DirectML ili TensorRT-LLM.
"Modeli Phi-3 značajno nadmašuju jezične modele iste i veće veličine na ključnim mjerilima (pogledajte brojeve mjerila u nastavku, što je bolje)," Microsoft , rekao je prilikom lansiranja modela, hvaleći se da male i srednje verzije mogu nadmašiti veće modele poput GPT-3.5T.
Mini verzija je ono što je trenutno dostupno na tržištu, ali Microsoft je obećao da će sva ostala dva modela biti dostupna uskoro. Također možete isprobati Phi-3 Mini na Azure AI i Hugging Face.