Το νέο LLM της Apple: MM1 θα μπορούσε να μειώσει την ανάγκη για πολλαπλές προτροπές για να έχετε το επιθυμητό αποτέλεσμα

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση

Εικονίδιο ημερολογίου Δημοσιεύθηκε στις Μαρτίου 18, 2024

Δημοσιεύθηκε στις Μαρτίου 18, 2024

Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας.

Βασικές σημειώσεις

Το MM1 της Apple είναι ένα νέο μοντέλο τεχνητής νοημοσύνης που εκπαιδεύεται σε δεδομένα κειμένου και εικόνας, δυνητικά τροφοδοτώντας το Siri 2.0.
Το MM1 χρησιμοποιεί μια πολυτροπική προσέγγιση για να επιτύχει καλύτερη απόδοση και να μειώσει την ανάγκη για πολλαπλές προτροπές.
Η μοναδική αρχιτεκτονική και το μοντέλο MoE του MM1 του επιτρέπουν να λειτουργεί σε συσκευές όπως τα iPhone.

Η Apple ήταν σχετικά σιωπηλή σχετικά με τη δουλειά της σε μεγάλα γλωσσικά μοντέλα (LLM), αλλά μια νέα ερευνητική εργασία υποδηλώνει ότι προχωρούν γρήγορα. Το MM1 είναι μια νέα μέθοδος για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης που συνδυάζουν δεδομένα κειμένου και εικόνας, τα οποία θα μπορούσαν να επιταχύνουν την εκπαίδευση και να μειώσουν την ανάγκη για πολλαπλές προτροπές για να επιτευχθεί το επιθυμητό αποτέλεσμα. Αυτό έρχεται μέρες μετά Η Apple εξαγόρασε το DarwinAI.

Τι είναι το MM1;

Το MM1 είναι μια οικογένεια μοντέλων τεχνητής νοημοσύνης, με το μεγαλύτερο να φτάνει τις 30 δισεκατομμύρια παραμέτρους (μικρότερο από ορισμένους ανταγωνιστές αλλά εξακολουθεί να είναι ισχυρό). Οι παράμετροι αναφέρονται στις αριθμητικές τιμές που χρησιμοποιεί το μοντέλο για να μάθει και να αναπαραστήσει τον κόσμο. Ένας υψηλότερος αριθμός παραμέτρων υποδηλώνει γενικά ένα πιο σύνθετο μοντέλο που μπορεί να χειριστεί ένα ευρύτερο φάσμα εργασιών και να παράγει πιο διαφοροποιημένα αποτελέσματα.

Επικεντρώνεται στην πολυτροπική μάθηση, που σημαίνει ότι μπορεί να επεξεργαστεί και να κατανοήσει τόσο κείμενο όσο και εικόνες. Αυτό θα μπορούσε να είναι ένα μεγάλο άλμα προς τα εμπρός για τη Siri, επιτρέποντάς της να κατανοήσει καλύτερα τα αιτήματά σας και να απαντήσει με πιο σχετικές πληροφορίες. Τον προηγούμενο μήνα, Η Apple εισήγαγε επίσης έναν χειριστή εικόνας AI.

Οι ερευνητές πίσω από το MM1 υποστηρίζουν ότι ο συνδυασμός διαφορετικών τύπων δεδομένων εκπαίδευσης οδηγεί σε καλύτερη απόδοση. Το MM1 χρησιμοποιεί α συνδυασμός λεζάντων εικόνων, δεδομένων μόνο κειμένου και οπτικής απάντησης ερωτήσεων για την εκπαίδευση του μοντέλου. Αυτό επιτρέπει στο MM1 να εκτελεί εργασίες όπως η δημιουργία λεζάντας εικόνων, η οπτική απάντηση ερωτήσεων και η κατανόηση φυσικής γλώσσας.

Το MM1 χρησιμοποιεί μια μοναδική αρχιτεκτονική με κωδικοποιητές υψηλότερης ανάλυσης εικόνας και μια διαφορετική προσέγγιση στα δεδομένα προεκπαίδευσης και επισήμανσης. Χρησιμοποιεί επίσης ένα μοντέλο μείγματος ειδικών (MoE) για να κλιμακωθεί διατηρώντας τις απαιτήσεις επεξεργασίας χαμηλές, πράγμα που σημαίνει ότι θα μπορούσε ενδεχομένως να λειτουργεί σε συσκευές όπως iPhone και φορητούς υπολογιστές.

Το ερευνητικό έγγραφο δεν αναφέρει ρητά το Siri, αλλά η εστίαση στην αποτελεσματικότητα, τις ελάχιστες προτροπές και τις πολυτροπικές δυνατότητες υποδηλώνουν την κατεύθυνση της Apple για το μέλλον της Siri. Νωρίτερα, α Ο leaker πρότεινε ένα πιο έξυπνο Siri με προσφορές συνδρομής GenAI.

Με Η Apple φέρνει άλλα LLM όπως το Gemini στο iPhone, φαίνεται ότι η Apple ακολουθεί μια πολύπλευρη προσέγγιση στις εξελίξεις της τεχνητής νοημοσύνης.

Περισσότερα εδώ.

Ντεβές Μπέρι

Δημοσιογράφος τεχνολογίας

Αυτά είναι τα πράγματα που με παρακινούν - δημιουργώ ενημερωτικό και χρήσιμο περιεχόμενο, επιδιώκω το πάθος μου για τα μηχανοκίνητα αθλήματα και τη μουσική, συμμετέχω σε αποστολές, διατηρώ έναν υγιεινό τρόπο ζωής και περνάω χρόνο με την αξιολάτρευτη γάτα μου Taco.