Microsoftin Phi-2 2.7B -malli ylittää äskettäin julkistetun Google Gemini Nano-2 3.2B -mallin

2 min. lukea

Julkaistu Joulukuu 12, 2023

Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta.

Viime kuukausina Microsoft Research on julkaissut sarjan pieniä kielimalleja (SLM) nimeltä "Phi". Phi-1 julkaistiin ensin 1.3 miljardilla parametrilla ja se oli erikoistunut Pythonin peruskoodaukseen. Syyskuussa Microsoft Research julkaistu Phi-1.5-malli 1.3 miljardilla parametrilla, mutta se koulutettiin uudella tietolähteellä, joka sisälsi erilaisia synteettisiä NLP-tekstejä. Pienestä koostaan huolimatta phi-1.5 tarjosi lähes huippuluokan suorituskykyä muihin samankokoisiin malleihin verrattuna.

Microsoft ilmoitti tänään julkaisevansa Phi-2-mallin, jossa on 2.7 miljardia parametria. Microsoft Research väittää, että tämä uusi SLM tarjoaa huippuluokan suorituskyvyn peruskielimalleissa, joissa on alle 13 miljardia parametria. Joissakin monimutkaisissa vertailuissa Phi-2 vastaa jopa 25 kertaa suurempia malleja tai ylittää sen.

Viime viikolla Google ilmoitti Gemini sarja kielimalleja. Gemini Nano on Googlen tehokkain malli, joka on rakennettu laitteella suoritettaviin tehtäviin, ja se voi toimia suoraan mobiilipiillä. Gemini Nano -tyyppinen pieni kielimalli mahdollistaa ominaisuuksia, kuten tekstin yhteenvedon, kontekstuaaliset älykkäät vastaukset sekä edistyneen oikolukemisen ja kieliopin korjauksen.

Microsoftin mukaan uusi Phi-2-malli vastaa tai ylittää uuden Google Gemini Nano-2:n, vaikka se on pienempi koko. Löydät Google Gemini Nano-2- ja Phi-2-mallien vertailut alta.

Malli	Koko	BBH	BoolQ	MBPP	MMLU
Gemini Nano 2	3.2B	42.4	79.3	27.2	55.8
Phi-2	2.7B	59.3	83.3	59.1	56.7

Sen lisäksi, että Phi-2 on parempi kuin Gemini Nano-2, se ylittää myös Mistral- ja Llama-2-mallien suorituskyvyn 7B- ja 13B-parametreilla erilaisissa vertailuissa. Katso tiedot alta.

Malli	Koko	BBH	Commonsense perustelut	Kieli Ymmärtäminen	Matematiikka	Koodaus
Laama-2	7B	40.0	62.2	56.7	16.5	21.0
	13B	47.8	65.0	61.9	34.2	25.4
	70B	66.5	69.2	67.6	64.1	38.3
mistraali	7B	57.2	66.4	63.7	46.4	39.4
Phi-2	2.7B	59.2	68.8	62.0	61.1	53.7

Vaikka kaksi edellistä phi-mallia oli saatavilla Hugging Facessa, Phi-2 on julkaistu Azure-malliluettelossa. Voit oppia lisää Phi-2:sta tätä.

Lisää aiheista: microsoft, microsoft -tutkimus, Phi-1, Phi-2

Pradeep Viswav

Ohjelmisto- ja palveluasiantuntija

Pradeep on tietojenkäsittelytieteen ja tekniikan tutkinnon suorittanut. Hän oli myös Microsoft Student Partner. Tällä hetkellä hän työskentelee johtavassa IT-yrityksessä.