Το xAI του Elon Musk ανακοινώνει το Grok-1.5 Vision, με πολυτροπική ικανότητα

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Βασικές σημειώσεις

  • Το xAI του Elon Musk ανακοίνωσε το Grok-1.5 Vision ή το Grok-1.5V.
  • Το Grok-1.5V είναι το πρώτο πολυτροπικό μοντέλο της εταιρείας και θα είναι σύντομα διαθέσιμο στους πρώτους δοκιμαστές και στους υπάρχοντες χρήστες του Grok.
  • Το Grok-1.5V μπορεί να επεξεργαστεί κείμενο και οπτικές πληροφορίες.

Τον περασμένο μήνα, ο Έλον Μασκ ξεκίνησε το Grok-1.5 LLM λίγες μέρες μετά Η Google κυκλοφόρησε το Gemini 1.5. Ενώ το xAI του Musk ισχυρίστηκε ότι το μοντέλο του είναι κοντά στην απόδοση του GPT-4, δεν έχει πολυτροπική ικανότητα. Ωστόσο, το Grok-1.5 Vision που ανακοινώθηκε πρόσφατα από την εταιρεία δεν έχει αυτόν τον περιορισμό, καθώς μπορεί να επεξεργαστεί τόσο κείμενο όσο και οπτικές πληροφορίες.

Τι είναι το Grok-1.5 Vision (Grok-1.5V) και πότε θα είναι διαθέσιμο;

Το Grok-1.5V είναι το πολυτροπικό μοντέλο πρώτης γενιάς της xAI που στοχεύει στη σύνδεση του ψηφιακού και του φυσικού κόσμου. «Η Grok ξεπερνά τους ομοτίμους της στο νέο μας σημείο αναφοράς RealWorldQA που μετρά τη χωρική κατανόηση του πραγματικού κόσμου», δήλωσε η εταιρεία σε ανάρτηση. Επιπλέον, το Grok-1.5V μπορεί να «επεξεργάζεται μια μεγάλη ποικιλία οπτικών πληροφοριών, συμπεριλαμβανομένων εγγράφων, διαγραμμάτων, διαγραμμάτων, στιγμιότυπων οθόνης και φωτογραφιών».

Για παράδειγμα, μερικά από τα συναρπαστικά πράγματα που μπορεί να κάνει περιλαμβάνουν τη σύνταξη κώδικα από ένα διάγραμμα, τον υπολογισμό των θερμίδων, τη δημιουργία ιστοριών πριν τον ύπνο βασισμένες σε σχέδια, τη βοήθεια που σας βοηθά να κατανοήσετε ένα μιμίδιο και πολλά άλλα. Η xAI ισχυρίζεται ότι το Grok-1.5V αποδίδει καλύτερα από τα αντίπαλά του LLM, συμπεριλαμβανομένων των GPT-4V, Claude 3Sonnet, Claude 3 Opus και Gemini Pro, στο σημείο αναφοράς RealWorldQA.

«Η Grok ξεπερνά τους ομοτίμους της στο νέο μας σημείο αναφοράς RealWorldQA που μετρά τη χωρική κατανόηση του πραγματικού κόσμου», τόνισε η xAI.

Το Grok-1.5V δεν είναι προς το παρόν διαθέσιμο, αλλά έρχεται σύντομα στους πρώτους δοκιμαστές και στους υπάρχοντες χρήστες του Grok ως προεπισκόπηση. Αν και το xAI δεν έχει καθορίσει την ημερομηνία κυκλοφορίας, έχει υποσχεθεί ότι θα προωθήσει περαιτέρω την «πολυτροπική κατανόηση» και τις «δυνατότητες γενιάς» και θα φέρει βελτιώσεις σε διάφορους τρόπους, όπως εικόνες, ήχος και βίντεο.

φόρουμ χρηστών

μηνύματα 0