Microsoftov model Phi-2 2.7B prekaša nedavno napovedani model Google Gemini Nano-2 3.2B

2 min. prebrati

Objavljeno dne December 12, 2023

Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo.

V zadnjih nekaj mesecih je Microsoft Research izdal zbirko majhnih jezikovnih modelov (SLM), imenovanih "Phi". Phi-1 je bil prvi izdan z 1.3 milijarde parametrov in je bil specializiran za osnovno kodiranje Python. Septembra Microsoft Research sprosti Phi-1.5 model z 1.3 milijarde parametrov, vendar je bil usposobljen z novim virom podatkov, ki je vključeval različna NLP sintetična besedila. Kljub svoji majhnosti je phi-1.5 zagotavljal skoraj najsodobnejšo zmogljivost v primerjavi z drugimi modeli podobne velikosti.

Danes je Microsoft napovedal izdajo modela Phi-2 z 2.7 milijarde parametrov. Microsoft Research trdi, da ta novi SLM zagotavlja najsodobnejšo zmogljivost med osnovnimi jezikovnimi modeli z manj kot 13 milijardami parametrov. Pri nekaterih zapletenih merilih uspešnosti se Phi-2 ujema z do 25-krat večjimi modeli ali jih prekaša.

Prejšnji teden, Google razglasitve Nabor jezikovnih modelov Gemini. Gemini Nano je Googlov najučinkovitejši model, izdelan za opravila v napravi, in lahko deluje neposredno na mobilnem silikonu. Gemini Nano podoben majhen jezikovni model omogoča funkcije, kot so povzemanje besedila, kontekstualni pametni odgovori ter napredno lektoriranje in popravljanje slovnice.

Po mnenju Microsofta se novi model Phi-2 ujema ali prekaša novi Google Gemini Nano-2, čeprav je manjši. Primerjavo meril uspešnosti med modeloma Google Gemini Nano-2 in Phi-2 najdete spodaj.

Model	Velikosti	bbh	BoolQ	MBPP	MMLU
Gemini Nano 2	3.2B	42.4	79.3	27.2	55.8
Phi-2	2.7B	59.3	83.3	59.1	56.7

Poleg tega, da prekaša Gemini Nano-2, Phi-2 prekaša tudi zmogljivost modelov Mistral in Llama-2 pri parametrih 7B in 13B na različnih merilih. Poiščite podrobnosti spodaj.