Microsoftov model Phi-2 2.7B prekaša nedavno napovedani model Google Gemini Nano-2 3.2B

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

Microsoft Phi-2

V zadnjih nekaj mesecih je Microsoft Research izdal zbirko majhnih jezikovnih modelov (SLM), imenovanih "Phi". Phi-1 je bil prvi izdan z 1.3 milijarde parametrov in je bil specializiran za osnovno kodiranje Python. Septembra Microsoft Research sprosti Phi-1.5 model z 1.3 milijarde parametrov, vendar je bil usposobljen z novim virom podatkov, ki je vključeval različna NLP sintetična besedila. Kljub svoji majhnosti je phi-1.5 zagotavljal skoraj najsodobnejšo zmogljivost v primerjavi z drugimi modeli podobne velikosti.

Danes je Microsoft napovedal izdajo modela Phi-2 z 2.7 milijarde parametrov. Microsoft Research trdi, da ta novi SLM zagotavlja najsodobnejšo zmogljivost med osnovnimi jezikovnimi modeli z manj kot 13 milijardami parametrov. Pri nekaterih zapletenih merilih uspešnosti se Phi-2 ujema z do 25-krat večjimi modeli ali jih prekaša.

Prejšnji teden, Google razglasitve Nabor jezikovnih modelov Gemini. Gemini Nano je Googlov najučinkovitejši model, izdelan za opravila v napravi, in lahko deluje neposredno na mobilnem silikonu. Gemini Nano podoben majhen jezikovni model omogoča funkcije, kot so povzemanje besedila, kontekstualni pametni odgovori ter napredno lektoriranje in popravljanje slovnice.

Po mnenju Microsofta se novi model Phi-2 ujema ali prekaša novi Google Gemini Nano-2, čeprav je manjši. Primerjavo meril uspešnosti med modeloma Google Gemini Nano-2 in Phi-2 najdete spodaj.

ModelVelikostibbhBoolQMBPPMMLU
Gemini Nano 23.2B42.479.327.255.8
Phi-22.7B59.383.359.156.7

Poleg tega, da prekaša Gemini Nano-2, Phi-2 prekaša tudi zmogljivost modelov Mistral in Llama-2 pri parametrih 7B ​​in 13B na različnih merilih. Poiščite podrobnosti spodaj.

ModelVelikostibbhZdrava pamet
Obrazložitev
Jezik
Razumevanje
MatematikaKodiranje
Lama-27B40.062.256.716.521.0
13B47.865.061.934.225.4
70B66.569.267.664.138.3
Mistral7B57.266.463.746.439.4
Phi-22.7B59.268.862.061.153.7

Medtem ko sta bila prejšnja dva modela phi na voljo na Hugging Face, Phi-2 je na voljo v katalogu modelov Azure. Izvedete lahko več o Phi-2 tukaj.

Več o temah: microsoft, Microsoftove raziskave, Phi-1, Phi-2