דגמי שפת הקוד הפתוח של DBRX החדשים של Databricks בשווי 10 מיליון דולר, סוף סוף כאן

עבור מודל קוד פתוח שעלה 10 מיליון דולר וחודשיים לאימון, זה מרשים.

סמל זמן קריאה 2 דקות לקרוא


קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו. סמל טיפים

קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קראו עוד

הערות עיקריות

  • Databricks משיקה את DBRX, סט דגמי הבינה המלאכותית שלה ב-GitHub וב-Huging Face.
  • DBRX כולל DBRX Base עבור משימות מבוססות הוראות ו-DBRX Instruct להתאמה אישית.
  • היא דורשת חומרה רבת עוצמה כדי לרוץ ולהתעלה על דגמים אחרים כמו GPT-3.5.

Databricks הודיעה לאחרונה שכן משיקה DBRX, סט דגמי הבינה המלאכותית הגנרטיבית שלה, הזמינה כעת ב-GitHub וב-Huging Face. הוא מאומן מראש על אסימוני 12T, משתמש ב-GLU ו-GQA, ואינו מולטי-מודאלי (לא יכול להריץ תמונות).

לדגם שתי גרסאות, ה-DBRX Base, המותאם למשימות מבוססות הוראות, וה-DBRX Instruct, דגם מאומן מראש המתאים להתאמה אישית נוספת. מודל הפרמטרים 132B הוא קוד פתוח וזמין באנגלית, אם כי הוא טוען שהוא מסוגל לתרגם גם לצרפתית, גרמנית וספרדית.

סמנכ"ל הבינה המלאכותית הגנרטיבית של Databricks, Naveen Rao, נחשפה ב-a TechCrunch ראיון שהחברה השקיעה 10 מיליון דולר וחודשיים בהכשרת הדוגמניות. אבל הקאץ' הוא שהפעלת הדגמים האלה דורשת חומרה כבדה, כמו מינימום של 4 Nvidia H100 GPUs או שווה ערך, בסך הכל 320GB של זיכרון, או ענן של צד שלישי עם דרישות דומות פחות או יותר. 

על פי שלה בידיעה שהונפקה לתקשורת, DBRX טוענת שהיא יכולה להתעלות על דגמי קוד פתוח קיימים כמו LLaMA2-70B, GPT-3.5, Mixtral ו- גרוק-1 על דברים מסוימים כמו מתמטיקה, לוגיקה ועוד. אתה יכול להפעיל אותם ישירות עם Databricks Model Serving או להתאים אותם עוד יותר לצרכים ספציפיים שכן הם מורשים לשימוש עם Databricks Open Model License. 

ניתן לפרוס אותם ישירות ל-Databricks Model Serving או להשתמש בהם למטרות כוונון עדין והסקת אצווה.

אתה יכול לנסות את דגמי הקוד הפתוח של DBRX של Databricks כאן.