Το μοντέλο Phi-2 2.7B της Microsoft ξεπερνά το μοντέλο Google Gemini Nano-2 3.2B που ανακοινώθηκε πρόσφατα
2 λεπτό. ανάγνωση
Δημοσιεύθηκε στις
Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα
Τους τελευταίους μήνες, η Microsoft Research κυκλοφόρησε μια σουίτα μοντέλων μικρών γλωσσών (SLM) που ονομάζεται "Phi". Το Phi-1 κυκλοφόρησε πρώτο με 1.3 δισεκατομμύρια παραμέτρους και ήταν εξειδικευμένο στη βασική κωδικοποίηση Python. Τον Σεπτέμβριο, η Microsoft Research κυκλοφόρησε Μοντέλο Phi-1.5 με 1.3 δισεκατομμύρια παραμέτρους, αλλά εκπαιδεύτηκε με μια νέα πηγή δεδομένων που περιλάμβανε διάφορα συνθετικά κείμενα NLP. Παρά το μικρό του μέγεθος, το phi-1.5 παρείχε απόδοση σχεδόν αιχμής σε σύγκριση με άλλα μοντέλα παρόμοιου μεγέθους.
Σήμερα, η Microsoft ανακοίνωσε την κυκλοφορία του μοντέλου Phi-2 με 2.7 δισεκατομμύρια παραμέτρους. Η Microsoft Research ισχυρίζεται ότι αυτό το νέο SLM προσφέρει κορυφαίες επιδόσεις μεταξύ μοντέλων βασικών γλωσσών με λιγότερες από 13 δισεκατομμύρια παραμέτρους. Σε ορισμένα πολύπλοκα σημεία αναφοράς, το Phi-2 ταιριάζει ή έχει καλύτερη απόδοση με μοντέλα έως και 25 φορές μεγαλύτερα.
Την περασμένη εβδομάδα, η Google ανακοίνωσε Σουίτα γλωσσικών μοντέλων Gemini. Το Gemini Nano είναι το πιο αποτελεσματικό μοντέλο της Google που έχει κατασκευαστεί για εργασίες στη συσκευή και μπορεί να τρέξει απευθείας σε σιλικόνη για κινητά. Το μοντέλο μικρής γλώσσας όπως το Gemini Nano επιτρέπει λειτουργίες όπως σύνοψη κειμένου, έξυπνες απαντήσεις με βάση τα συμφραζόμενα και προηγμένη διόρθωση και διόρθωση γραμματικής.
Σύμφωνα με τη Microsoft, το νέο μοντέλο Phi-2 ταιριάζει ή υπερτερεί του νέου Google Gemini Nano-2, παρόλο που είναι μικρότερο σε μέγεθος. Μπορείτε να βρείτε τη σύγκριση σημείων αναφοράς μεταξύ των μοντέλων Google Gemini Nano-2 και Phi-2 παρακάτω.
Μοντέλο | Μέγεθος | BBH | BoolQ | MBPP | MMLU |
---|---|---|---|---|---|
Gemini Nano 2 | 3.2B | 42.4 | 79.3 | 27.2 | 55.8 |
Phi-2 | 2.7B | 59.3 | 83.3 | 59.1 | 56.7 |
Εκτός από την καλύτερη απόδοση του Gemini Nano-2, το Phi-2 ξεπερνά επίσης τις επιδόσεις των μοντέλων Mistral και Llama-2 σε παραμέτρους 7B και 13B σε διάφορα σημεία αναφοράς. Βρείτε τις λεπτομέρειες παρακάτω.
Μοντέλο | Μέγεθος | BBH | ΚΟΙΝΗ ΛΟΓΙΚΗ Αιτιολογία | Γλώσσα Κατανόηση | μαθηματικά | Κωδικοποίηση |
---|---|---|---|---|---|---|
Λάμα-2 | 7B | 40.0 | 62.2 | 56.7 | 16.5 | 21.0 |
13B | 47.8 | 65.0 | 61.9 | 34.2 | 25.4 | |
70B | 66.5 | 69.2 | 67.6 | 64.1 | 38.3 | |
Mistral | 7B | 57.2 | 66.4 | 63.7 | 46.4 | 39.4 |
Phi-2 | 2.7B | 59.2 | 68.8 | 62.0 | 61.1 | 53.7 |
Ενώ τα δύο προηγούμενα μοντέλα phi ήταν διαθέσιμα στο Hugging Face, Phi-2 έχει διατεθεί στον κατάλογο μοντέλων Azure. Μπορείτε να μάθετε περισσότερα για το Phi-2 εδώ.