ה-xAI של אילון מאסק מכריז על Grok-1.5 Vision, עם יכולת מולטי-מודאלית

סמל זמן קריאה 2 דקות לקרוא


קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו. סמל טיפים

קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קראו עוד

הערות עיקריות

  • ה-xAI של אילון מאסק הכריז על Grok-1.5 Vision או Grok-1.5V.
  • Grok-1.5V הוא הדגם המולטי-מודאלי הראשון של החברה ויהיה זמין לבודקים מוקדמים ולמשתמשי Grok קיימים בקרוב.
  • Grok-1.5V יכול לעבד טקסט ומידע חזותי.

בחודש שעבר השיק אילון מאסק את Grok-1.5 LLM ימים לאחר מכן גוגל השיקה את Gemini 1.5. בעוד שה-xAI של מאסק טען שהדגם שלו קרוב לביצועי GPT-4, אין לו יכולת מולטי-מודאלית. עם זאת, ל-Grok-1.5 Vision שהוכרז לאחרונה על ידי החברה אין מגבלה זו, מכיוון שהוא יכול לעבד גם טקסט וגם מידע ויזואלי.

מה זה Grok-1.5 Vision (Grok-1.5V) ומתי הוא יהיה זמין?

Grok-1.5V הוא המודל המולטי-מודאלי מהדור הראשון של xAI שמטרתו לחבר בין העולם הדיגיטלי והפיזי. "Grok מתעלה על עמיתיה במדד RealWorldQA החדש שלנו שמודד הבנה מרחבית בעולם האמיתי", אמרה החברה ב- בלוג. בנוסף, Grok-1.5V יכול "לעבד מגוון רחב של מידע חזותי, כולל מסמכים, דיאגרמות, תרשימים, צילומי מסך ותצלומים."

לדוגמה, חלק מהדברים המרגשים שהוא יכול לעשות כוללים כתיבת קוד מתרשים, חישוב קלוריות, הכנת סיפורים לפני השינה על סמך ציורים, עזרה בהבנת מם ועוד. xAI טוענת ש-Grok-1.5V מתפקד טוב יותר מה-LLM המתחרים שלה, כולל GPT-4V, Claude 3Sonnet, Claude 3 Opus ו-Gemini Pro, במדד RealWorldQA.

"Grok מתעלה על עמיתיו במדד RealWorldQA החדש שלנו שמודד הבנה מרחבית בעולם האמיתי", הדגיש xAI.

Grok-1.5V אינו זמין כעת, אך הוא יגיע בקרוב לבודקים מוקדמים ולמשתמשי Grok קיימים כתצוגה מקדימה. למרות ש-xAI לא ציין את תאריך ההשקה, היא הבטיחה לקדם עוד יותר את "ההבנה הרב-מודאלית" ואת "יכולות הדור" ולהביא שיפורים בשיטות שונות כגון תמונות, אודיו ווידאו.

פורום משתמשים

0 הודעות