Το μοντέλο Phi-2 2.7B της Microsoft ξεπερνά το μοντέλο Google Gemini Nano-2 3.2B που ανακοινώθηκε πρόσφατα

2 λεπτό. ανάγνωση

Δημοσιεύθηκε στις Δεκέμβριος 12, 2023

Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας.

Τους τελευταίους μήνες, η Microsoft Research κυκλοφόρησε μια σουίτα μοντέλων μικρών γλωσσών (SLM) που ονομάζεται "Phi". Το Phi-1 κυκλοφόρησε πρώτο με 1.3 δισεκατομμύρια παραμέτρους και ήταν εξειδικευμένο στη βασική κωδικοποίηση Python. Τον Σεπτέμβριο, η Microsoft Research κυκλοφόρησε Μοντέλο Phi-1.5 με 1.3 δισεκατομμύρια παραμέτρους, αλλά εκπαιδεύτηκε με μια νέα πηγή δεδομένων που περιλάμβανε διάφορα συνθετικά κείμενα NLP. Παρά το μικρό του μέγεθος, το phi-1.5 παρείχε απόδοση σχεδόν αιχμής σε σύγκριση με άλλα μοντέλα παρόμοιου μεγέθους.

Σήμερα, η Microsoft ανακοίνωσε την κυκλοφορία του μοντέλου Phi-2 με 2.7 δισεκατομμύρια παραμέτρους. Η Microsoft Research ισχυρίζεται ότι αυτό το νέο SLM προσφέρει κορυφαίες επιδόσεις μεταξύ μοντέλων βασικών γλωσσών με λιγότερες από 13 δισεκατομμύρια παραμέτρους. Σε ορισμένα πολύπλοκα σημεία αναφοράς, το Phi-2 ταιριάζει ή έχει καλύτερη απόδοση με μοντέλα έως και 25 φορές μεγαλύτερα.

Την περασμένη εβδομάδα, η Google ανακοίνωσε Σουίτα γλωσσικών μοντέλων Gemini. Το Gemini Nano είναι το πιο αποτελεσματικό μοντέλο της Google που έχει κατασκευαστεί για εργασίες στη συσκευή και μπορεί να τρέξει απευθείας σε σιλικόνη για κινητά. Το μοντέλο μικρής γλώσσας όπως το Gemini Nano επιτρέπει λειτουργίες όπως σύνοψη κειμένου, έξυπνες απαντήσεις με βάση τα συμφραζόμενα και προηγμένη διόρθωση και διόρθωση γραμματικής.

Σύμφωνα με τη Microsoft, το νέο μοντέλο Phi-2 ταιριάζει ή υπερτερεί του νέου Google Gemini Nano-2, παρόλο που είναι μικρότερο σε μέγεθος. Μπορείτε να βρείτε τη σύγκριση σημείων αναφοράς μεταξύ των μοντέλων Google Gemini Nano-2 και Phi-2 παρακάτω.

Μοντέλο	Μέγεθος	BBH	BoolQ	MBPP	MMLU
Gemini Nano 2	3.2B	42.4	79.3	27.2	55.8
Phi-2	2.7B	59.3	83.3	59.1	56.7

Εκτός από την καλύτερη απόδοση του Gemini Nano-2, το Phi-2 ξεπερνά επίσης τις επιδόσεις των μοντέλων Mistral και Llama-2 σε παραμέτρους 7B και 13B σε διάφορα σημεία αναφοράς. Βρείτε τις λεπτομέρειες παρακάτω.

Μοντέλο	Μέγεθος	BBH	ΚΟΙΝΗ ΛΟΓΙΚΗ Αιτιολογία	Γλώσσα Κατανόηση	μαθηματικά	Κωδικοποίηση
Λάμα-2	7B	40.0	62.2	56.7	16.5	21.0
	13B	47.8	65.0	61.9	34.2	25.4
	70B	66.5	69.2	67.6	64.1	38.3
Mistral	7B	57.2	66.4	63.7	46.4	39.4
Phi-2	2.7B	59.2	68.8	62.0	61.1	53.7

Ενώ τα δύο προηγούμενα μοντέλα phi ήταν διαθέσιμα στο Hugging Face, Phi-2 έχει διατεθεί στον κατάλογο μοντέλων Azure. Μπορείτε να μάθετε περισσότερα για το Phi-2 εδώ.

Περισσότερα για τα θέματα: microsoft, έρευνα microsoft, Phi-1, Phi-2

Pradeep Viswav

Ειδικός Λογισμικού και Υπηρεσιών

Ο Pradeep είναι Πτυχιούχος Επιστήμης Υπολογιστών και Μηχανικών Υπολογιστών. Ήταν επίσης φοιτητής της Microsoft. Αυτή τη στιγμή εργάζεται σε κορυφαία εταιρεία πληροφορικής.