מיקרוסופט ו-NVIDIA מכריזות על מודל השפה הגדול והחזק ביותר שהוכשר עד כה

סמל זמן קריאה 1 דקות לקרוא

סמל לוח השנה פורסם ב אוקטובר 11, 2021

פורסם ב אוקטובר 11, 2021

קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו.

מיקרוסופט ו-NVIDIA הכריזו היום על מודל ה-Megatron-Turing Natural Language Generation (MT-NLG) המופעל על ידי DeepSpeed ו-Megatron, המודל הגדול והחזק ביותר של שפת השנאים המונוליטיים שהוכשר עד כה. דגם זה כולל 530 מיליארד פרמטרים, פי 3 ממספר הפרמטרים בהשוואה לדגם הגדול ביותר הקיים, GPT-3. אימון מודל כה גדול כרוך באתגרים שונים. NVIDIA ומיקרוסופט עבדו על חידושים ופריצות דרך רבות לאורך כל צירי הבינה המלאכותית.

לדוגמה, בשיתוף פעולה הדוק, NVIDIA ו-Microsoft השיגו יעילות אימון חסרת תקדים על ידי התכנסות של תשתית אימון משוכללת המואצת ב-GPU עם ערימת תוכנת למידה מבוזרת מתקדמת. בנינו קורפוסי אימון בשפה טבעית באיכות גבוהה עם מאות מיליארדי אסימונים, ופיתחנו במשותף מתכוני אימון לשיפור יעילות האופטימיזציה והיציבות.

אתה יכול ללמוד עוד על פרויקט זה מהקישורים למטה.

מקור: מיקרוסופט, Nvidia

עוד על הנושאים: מיקרוסופט, NVIDIA

פראדיפ ויסוואב

מומחה תוכנה ושירותים

פראדיפ הוא בוגר מדעי המחשב והנדסה. הוא גם היה שותף סטודנט של מיקרוסופט. כיום הוא עובד בחברת IT מובילה.

השאירו תגובה