Microsoftov model Phi-2 2.7B prekaša nedavno napovedani model Google Gemini Nano-2 3.2B
2 min. prebrati
Objavljeno dne
Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več
V zadnjih nekaj mesecih je Microsoft Research izdal zbirko majhnih jezikovnih modelov (SLM), imenovanih "Phi". Phi-1 je bil prvi izdan z 1.3 milijarde parametrov in je bil specializiran za osnovno kodiranje Python. Septembra Microsoft Research sprosti Phi-1.5 model z 1.3 milijarde parametrov, vendar je bil usposobljen z novim virom podatkov, ki je vključeval različna NLP sintetična besedila. Kljub svoji majhnosti je phi-1.5 zagotavljal skoraj najsodobnejšo zmogljivost v primerjavi z drugimi modeli podobne velikosti.
Danes je Microsoft napovedal izdajo modela Phi-2 z 2.7 milijarde parametrov. Microsoft Research trdi, da ta novi SLM zagotavlja najsodobnejšo zmogljivost med osnovnimi jezikovnimi modeli z manj kot 13 milijardami parametrov. Pri nekaterih zapletenih merilih uspešnosti se Phi-2 ujema z do 25-krat večjimi modeli ali jih prekaša.
Prejšnji teden, Google razglasitve Nabor jezikovnih modelov Gemini. Gemini Nano je Googlov najučinkovitejši model, izdelan za opravila v napravi, in lahko deluje neposredno na mobilnem silikonu. Gemini Nano podoben majhen jezikovni model omogoča funkcije, kot so povzemanje besedila, kontekstualni pametni odgovori ter napredno lektoriranje in popravljanje slovnice.
Po mnenju Microsofta se novi model Phi-2 ujema ali prekaša novi Google Gemini Nano-2, čeprav je manjši. Primerjavo meril uspešnosti med modeloma Google Gemini Nano-2 in Phi-2 najdete spodaj.
Model | Velikosti | bbh | BoolQ | MBPP | MMLU |
---|---|---|---|---|---|
Gemini Nano 2 | 3.2B | 42.4 | 79.3 | 27.2 | 55.8 |
Phi-2 | 2.7B | 59.3 | 83.3 | 59.1 | 56.7 |
Poleg tega, da prekaša Gemini Nano-2, Phi-2 prekaša tudi zmogljivost modelov Mistral in Llama-2 pri parametrih 7B in 13B na različnih merilih. Poiščite podrobnosti spodaj.
Model | Velikosti | bbh | Zdrava pamet Obrazložitev | Jezik Razumevanje | Matematika | Kodiranje |
---|---|---|---|---|---|---|
Lama-2 | 7B | 40.0 | 62.2 | 56.7 | 16.5 | 21.0 |
13B | 47.8 | 65.0 | 61.9 | 34.2 | 25.4 | |
70B | 66.5 | 69.2 | 67.6 | 64.1 | 38.3 | |
Mistral | 7B | 57.2 | 66.4 | 63.7 | 46.4 | 39.4 |
Phi-2 | 2.7B | 59.2 | 68.8 | 62.0 | 61.1 | 53.7 |
Medtem ko sta bila prejšnja dva modela phi na voljo na Hugging Face, Phi-2 je na voljo v katalogu modelov Azure. Izvedete lahko več o Phi-2 tukaj.