Microsoftin Phi-2 2.7B -malli ylittää äskettäin julkistetun Google Gemini Nano-2 3.2B -mallin

Lukuajan kuvake 2 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Microsoft Phi-2

Viime kuukausina Microsoft Research on julkaissut sarjan pieniä kielimalleja (SLM) nimeltä "Phi". Phi-1 julkaistiin ensin 1.3 miljardilla parametrilla ja se oli erikoistunut Pythonin peruskoodaukseen. Syyskuussa Microsoft Research julkaistu Phi-1.5-malli 1.3 miljardilla parametrilla, mutta se koulutettiin uudella tietolähteellä, joka sisälsi erilaisia ​​synteettisiä NLP-tekstejä. Pienestä koostaan ​​huolimatta phi-1.5 tarjosi lähes huippuluokan suorituskykyä muihin samankokoisiin malleihin verrattuna.

Microsoft ilmoitti tänään julkaisevansa Phi-2-mallin, jossa on 2.7 miljardia parametria. Microsoft Research väittää, että tämä uusi SLM tarjoaa huippuluokan suorituskyvyn peruskielimalleissa, joissa on alle 13 miljardia parametria. Joissakin monimutkaisissa vertailuissa Phi-2 vastaa jopa 25 kertaa suurempia malleja tai ylittää sen.

Viime viikolla Google ilmoitti Gemini sarja kielimalleja. Gemini Nano on Googlen tehokkain malli, joka on rakennettu laitteella suoritettaviin tehtäviin, ja se voi toimia suoraan mobiilipiillä. Gemini Nano -tyyppinen pieni kielimalli mahdollistaa ominaisuuksia, kuten tekstin yhteenvedon, kontekstuaaliset älykkäät vastaukset sekä edistyneen oikolukemisen ja kieliopin korjauksen.

Microsoftin mukaan uusi Phi-2-malli vastaa tai ylittää uuden Google Gemini Nano-2:n, vaikka se on pienempi koko. Löydät Google Gemini Nano-2- ja Phi-2-mallien vertailut alta.

MalliKokoBBHBoolQMBPPMMLU
Gemini Nano 23.2B42.479.327.255.8
Phi-22.7B59.383.359.156.7

Sen lisäksi, että Phi-2 on parempi kuin Gemini Nano-2, se ylittää myös Mistral- ja Llama-2-mallien suorituskyvyn 7B- ja 13B-parametreilla erilaisissa vertailuissa. Katso tiedot alta.

MalliKokoBBHCommonsense
perustelut
Kieli
Ymmärtäminen
MatematiikkaKoodaus
Laama-27B40.062.256.716.521.0
13B47.865.061.934.225.4
70B66.569.267.664.138.3
mistraali7B57.266.463.746.439.4
Phi-22.7B59.268.862.061.153.7

Vaikka kaksi edellistä phi-mallia oli saatavilla Hugging Facessa, Phi-2 on julkaistu Azure-malliluettelossa. Voit oppia lisää Phi-2:sta tätä.

Lisää aiheista: microsoft, microsoft -tutkimus, Phi-1, Phi-2