Το μοντέλο Phi-2 2.7B της Microsoft ξεπερνά το μοντέλο Google Gemini Nano-2 3.2B που ανακοινώθηκε πρόσφατα

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Microsoft Phi-2

Τους τελευταίους μήνες, η Microsoft Research κυκλοφόρησε μια σουίτα μοντέλων μικρών γλωσσών (SLM) που ονομάζεται "Phi". Το Phi-1 κυκλοφόρησε πρώτο με 1.3 δισεκατομμύρια παραμέτρους και ήταν εξειδικευμένο στη βασική κωδικοποίηση Python. Τον Σεπτέμβριο, η Microsoft Research κυκλοφόρησε Μοντέλο Phi-1.5 με 1.3 δισεκατομμύρια παραμέτρους, αλλά εκπαιδεύτηκε με μια νέα πηγή δεδομένων που περιλάμβανε διάφορα συνθετικά κείμενα NLP. Παρά το μικρό του μέγεθος, το phi-1.5 παρείχε απόδοση σχεδόν αιχμής σε σύγκριση με άλλα μοντέλα παρόμοιου μεγέθους.

Σήμερα, η Microsoft ανακοίνωσε την κυκλοφορία του μοντέλου Phi-2 με 2.7 δισεκατομμύρια παραμέτρους. Η Microsoft Research ισχυρίζεται ότι αυτό το νέο SLM προσφέρει κορυφαίες επιδόσεις μεταξύ μοντέλων βασικών γλωσσών με λιγότερες από 13 δισεκατομμύρια παραμέτρους. Σε ορισμένα πολύπλοκα σημεία αναφοράς, το Phi-2 ταιριάζει ή έχει καλύτερη απόδοση με μοντέλα έως και 25 φορές μεγαλύτερα.

Την περασμένη εβδομάδα, η Google ανακοίνωσε Σουίτα γλωσσικών μοντέλων Gemini. Το Gemini Nano είναι το πιο αποτελεσματικό μοντέλο της Google που έχει κατασκευαστεί για εργασίες στη συσκευή και μπορεί να τρέξει απευθείας σε σιλικόνη για κινητά. Το μοντέλο μικρής γλώσσας όπως το Gemini Nano επιτρέπει λειτουργίες όπως σύνοψη κειμένου, έξυπνες απαντήσεις με βάση τα συμφραζόμενα και προηγμένη διόρθωση και διόρθωση γραμματικής.

Σύμφωνα με τη Microsoft, το νέο μοντέλο Phi-2 ταιριάζει ή υπερτερεί του νέου Google Gemini Nano-2, παρόλο που είναι μικρότερο σε μέγεθος. Μπορείτε να βρείτε τη σύγκριση σημείων αναφοράς μεταξύ των μοντέλων Google Gemini Nano-2 και Phi-2 παρακάτω.

ΜοντέλοΜέγεθοςBBHBoolQMBPPMMLU
Gemini Nano 23.2B42.479.327.255.8
Phi-22.7B59.383.359.156.7

Εκτός από την καλύτερη απόδοση του Gemini Nano-2, το Phi-2 ξεπερνά επίσης τις επιδόσεις των μοντέλων Mistral και Llama-2 σε παραμέτρους 7B και 13B σε διάφορα σημεία αναφοράς. Βρείτε τις λεπτομέρειες παρακάτω.

ΜοντέλοΜέγεθοςBBHΚΟΙΝΗ ΛΟΓΙΚΗ
Αιτιολογία
Γλώσσα
Κατανόηση
μαθηματικάΚωδικοποίηση
Λάμα-27B40.062.256.716.521.0
13B47.865.061.934.225.4
70B66.569.267.664.138.3
Mistral7B57.266.463.746.439.4
Phi-22.7B59.268.862.061.153.7

Ενώ τα δύο προηγούμενα μοντέλα phi ήταν διαθέσιμα στο Hugging Face, Phi-2 έχει διατεθεί στον κατάλογο μοντέλων Azure. Μπορείτε να μάθετε περισσότερα για το Phi-2 εδώ.

Περισσότερα για τα θέματα: microsoft, έρευνα microsoft, Phi-1, Phi-2