Η Microsoft ανακοινώνει το Phi-3-vision, ένα νέο πολυτροπικό SLM για σενάρια τεχνητής νοημοσύνης στη συσκευή

Εικονίδιο ώρας ανάγνωσης 1 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Βασικές σημειώσεις

  • Το Phi-3-vision είναι ένα μοντέλο παραμέτρων 4.2Β που υποστηρίζει εργασίες γενικής οπτικής συλλογιστικής και συλλογιστική γραφήματος/γραφήματος/πίνακα

Στο Build 2024, η Microsoft σήμερα επεκτάθηκε Η οικογένεια μοντέλων μικρών γλωσσών τεχνητής νοημοσύνης Phi-3 με το νέο Phi-3-vision. Το Phi-3-vision είναι ένα μοντέλο παραμέτρων 4.2Β που υποστηρίζει εργασίες γενικής οπτικής συλλογιστικής και συλλογιστική γραφήματος/γραφήματος/πίνακα. Το μοντέλο μπορεί να λάβει και εικόνες και κείμενο ως είσοδο και ως απάντηση κειμένου εξόδου.

Η Microsoft ανακοίνωσε επίσης σήμερα τη γενική διαθεσιμότητα του Phi-3-mini στην προσφορά Models-as-a Service (MaaS) του Azure AI. Μοντέλα Phi-3 κερδίζουν δυναμική, καθώς είναι οικονομικά αποδοτικά και βελτιστοποιημένα για σενάρια τεχνητής νοημοσύνης με δεσμευμένο λανθάνοντα χρόνο, εντός συσκευής, άκρων, συμπερασμάτων εκτός σύνδεσης.

Εκτός από τα νέα σχετικά με τα μοντέλα Phi-3, η Microsoft ανακοίνωσε νέες δυνατότητες σε όλα τα API για την ενεργοποίηση πολυτροπικών εμπειριών. Το Azure AI Speech διαθέτει πλέον αναλυτικά στοιχεία ομιλίας και καθολική μετάφραση. Το Azure AI Search έρχεται τώρα με σημαντικά αυξημένο χώρο αποθήκευσης και έως και 12X αύξηση στο μέγεθος του διανυσματικού ευρετηρίου χωρίς πρόσθετο κόστος για να επιτρέψει μεγάλο φόρτο εργασίας RAG σε κλίμακα.

Περισσότερα για τα θέματα: microsoft, Phi-3-vision