Modelul Microsoft Phi-2 2.7B depășește modelul Google Gemini Nano-2 3.2B anunțat recent

Pictograma timp de citire 2 min. citit

Pictogramă calendar Publicat în data de December 12, 2023

publicat pe December 12, 2023

Cititorii ajută la sprijinirea MSpoweruser. Este posibil să primim un comision dacă cumpărați prin link-urile noastre.

În ultimele luni, Microsoft Research a lansat o suită de modele lingvistice mici (SLM) numită „Phi”. Phi-1 a fost lansat mai întâi cu 1.3 miliarde de parametri și a fost specializat pentru codificarea Python de bază. În septembrie, Microsoft Research eliberat Model Phi-1.5 cu 1.3 miliarde de parametri, dar a fost antrenat cu o nouă sursă de date care includea diverse texte sintetice NLP. În ciuda dimensiunilor sale mici, phi-1.5 a furnizat o performanță aproape de ultimă generație în comparație cu alte modele de dimensiuni similare.

Astăzi, Microsoft a anunțat lansarea modelului Phi-2 cu 2.7 miliarde de parametri. Microsoft Research susține că acest nou SLM oferă performanțe de ultimă generație printre modelele de limbaj de bază cu mai puțin de 13 miliarde de parametri. Pe unele benchmark-uri complexe, Phi-2 se potrivește sau depășește modelele de până la 25 de ori mai mari.

Săptămâna trecută, Google a anunțat Suita Gemini de modele de limbaj. Gemini Nano este cel mai eficient model Google construit pentru sarcini pe dispozitiv și poate rula direct pe siliciu mobil. Modelul de limbaj mic asemănător Gemini Nano permite funcții precum rezumarea textului, răspunsurile inteligente contextuale și corectarea avansată și corectarea gramaticală.

Potrivit Microsoft, noul model Phi-2 se potrivește sau depășește noul Google Gemini Nano-2, în ciuda faptului că este mai mic ca dimensiune. Puteți găsi mai jos comparația de referințe între modelele Google Gemini Nano-2 și Phi-2.

Model	Mărimea	bbh	BoolQ	MBPP	MMLU
Gemeni Nano 2	3.2B	42.4	79.3	27.2	55.8
Phi-2	2.7B	59.3	83.3	59.1	56.7

Pe lângă faptul că depășește Gemini Nano-2, Phi-2 depășește și performanța modelelor Mistral și Llama-2 la parametrii 7B și 13B pe diferite benchmark-uri. Găsiți detaliile mai jos.

Model	Mărimea	bbh	Bun simț Raţionament	Limbă Înțelegerea	matematica	Codificare
Lama-2	7B	40.0	62.2	56.7	16.5	21.0
	13B	47.8	65.0	61.9	34.2	25.4
	70B	66.5	69.2	67.6	64.1	38.3
Mistral	7B	57.2	66.4	63.7	46.4	39.4
Phi-2	2.7B	59.2	68.8	62.0	61.1	53.7

În timp ce precedentele două modele phi au fost disponibile pe Hugging Face, Phi-2 a fost pus la dispoziție în catalogul de modele Azure. Puteți afla mai multe despre Phi-2 aici.

Mai multe despre subiecte: microsoft, cercetare Microsoft, Phi-1, Phi-2

Pradeep Viswav

Expert în software și servicii

Pradeep este absolvent de informatică și inginerie. A fost, de asemenea, partener student Microsoft. În prezent lucrează într-o companie lider în IT.

Lasă un comentariu