Microsoft trente Phi-3 Mini bare i en uke med Nvidias AI-vennlige H100 GPUer

Phi-3s Mini-versjon er den eneste modellen som er tilgjengelig for øyeblikket

Hjemprodukt » Nyheter

Ikon for lesetid 2 min. lese

Kalenderikon Publisert på April 24, 2024

by Rafly Gilang

publisert på April 24, 2024

Lesere hjelper til med å støtte MSpoweruser. Vi kan få provisjon hvis du kjøper gjennom lenkene våre.

Viktige merknader

Microsoft lanserte Phi-3-modeller, ledet av Phi-3 Mini med 3.8B parametere,
Modellen ble trent på 3.3 billioner tokens på syv dager ved bruk av 512 NVIDIA H100 GPUer.
Phi-3-familien inkluderer også små og mellomstore varianter, som overgår tidligere modeller som Phi-2.

Microsoft lanserte Phi-3-familien av modeller, en av de beste små modellene på markedet for øyeblikket. Og nå, Nvidia sa og beskrev hvordan Redmond-selskapet brukte sine H100 GPU-er for å trene disse modellene, eller mer spesifikt, Mini, 3.8B-versjonen.

"Modellen har 3.8 milliarder parametere og ble trent på 3.3 billioner tokens på bare syv dager på 512 NVIDIA H100 Tensor Core GPUer," sa teknologiprodusenten tirsdag.

Familien til Phi-3 kommer med tre varianter: Phi-3 Mini (3.8B), Phi-3 Small (7B) og Phi-3 Medium (14B). Det er en enorm forbedring fra forrige Phi-2 som ble lansert med bare 2.7B parametere for måneder siden.

Phi-3 Mini, mer spesifikt, kommer også med to alternativer avhengig av støttende tokens: 4K og 128K. Du kan prøve sistnevnte på Nvidias AI-senter som en Nvidia NIM-tjeneste for utviklere, og kjøre modellen lokalt ved hjelp av Windows DirectML eller TensorRT-LLM.

"Phi-3-modeller gir betydelig bedre resultater enn språkmodeller av samme og større størrelser på viktige benchmarks (se benchmark-tall nedenfor, høyere er bedre)," Microsoft sa ved lansering av modellene, skryte av at Small og Medium-versjonene kan utkonkurrere større modeller som GPT-3.5T.

Mini-versjonen er det som er tilgjengelig på markedet for øyeblikket, men Microsoft lovet at alle de to andre modellene vil være tilgjengelige snart. Du kan også prøve Phi-3 Mini på Azure AI og Hugging Face.

Rafly Gilang

Teknisk reporter

Rafly er en reporter med mange års journalistisk erfaring, alt fra teknologi, næringsliv, sosialt og kultur. Rapporterer for tiden nyheter om Microsoft-relaterte produkter, teknologi og kunstig intelligens på Windows Report og MSPowerUser. Har du et tips? Send den til [e-postbeskyttet].

Legg igjen en kommentar