מיקרוסופט מסמלת את DeepSpeed, ספריית ה-AI של טריליון פרמטרים

סמל זמן קריאה 2 דקות לקרוא


קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו. סמל טיפים

קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קרא עוד

מהירות עמוקה

מיקרוסופט הגישה בקשה לסימן מסחרי עבור DeepSpeed, ספריית הבינה המלאכותית המותאמת שלה המאפשרת הדרכה של דגמי בינה מלאכותית בקנה מידה גדול על חומרה צנועה.

הסימן המסחרי, שהוגש ב-8 בדצמבר 2020, מתייחס ל"מתן שימוש זמני בתוכנת מחשב מקוונת שאינה ניתנת להורדה לעיבוד בינה מלאכותית ולמידה עמוקה," מה שמציע שמיקרוסופט אולי חושבת להפוך את DeepSpeed ​​לזמינה באמצעות שירות ענן מקוון.

DeepSpeed, שיצאה בפברואר השנה, היא ספריית Python המאפשרת ליצור מודלים של למידה עמוקה עם טריליון פרמטרים, יותר מפי חמישה מאשר בדגם הגדול ביותר בעולם הנוכחי, תוך שימוש ב-800 כרטיסי מסך של Nvidia V100 בלבד. ללא DeepSpeed, אותה משימה תצריך 4,000 מכשירי Nvidia A100, שהם עד פי 2.5 מהירים יותר מה-V100, תוך כדי 100 ימים.

הכלי שימושי במיוחד לאחר ש-GPT-3 הראה שמודלים ממשיכים לשפר ככל שהרשת העצבית ומערך הנתונים גדולים יותר. עם זאת, הדבר איים לדחוף את החידושים האחרונים מחוץ להישג ידם של צוותים קטנים יותר עם פחות משאבים, אך DeepSpeed ​​אפשרה לצוותים הללו להתחרות בשירותים גדולים בהרבה עם חומרה מינימלית. מעבר לעיבוד ענן יכול להפוך אימון בינה מלאכותית לדגמים גדולים לנגישים עוד יותר.

קרא עוד על DeepSpeed ​​ב-Microsoft כאן, וראה את הסימן המסחרי כאן.

באמצעות אלומיניום