מיקרוסופט מסמלת את DeepSpeed, ספריית ה-AI של טריליון פרמטרים
2 דקות לקרוא
פורסם ב
קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קרא עוד
מיקרוסופט הגישה בקשה לסימן מסחרי עבור DeepSpeed, ספריית הבינה המלאכותית המותאמת שלה המאפשרת הדרכה של דגמי בינה מלאכותית בקנה מידה גדול על חומרה צנועה.
הסימן המסחרי, שהוגש ב-8 בדצמבר 2020, מתייחס ל"מתן שימוש זמני בתוכנת מחשב מקוונת שאינה ניתנת להורדה לעיבוד בינה מלאכותית ולמידה עמוקה," מה שמציע שמיקרוסופט אולי חושבת להפוך את DeepSpeed לזמינה באמצעות שירות ענן מקוון.
DeepSpeed, שיצאה בפברואר השנה, היא ספריית Python המאפשרת ליצור מודלים של למידה עמוקה עם טריליון פרמטרים, יותר מפי חמישה מאשר בדגם הגדול ביותר בעולם הנוכחי, תוך שימוש ב-800 כרטיסי מסך של Nvidia V100 בלבד. ללא DeepSpeed, אותה משימה תצריך 4,000 מכשירי Nvidia A100, שהם עד פי 2.5 מהירים יותר מה-V100, תוך כדי 100 ימים.
הכלי שימושי במיוחד לאחר ש-GPT-3 הראה שמודלים ממשיכים לשפר ככל שהרשת העצבית ומערך הנתונים גדולים יותר. עם זאת, הדבר איים לדחוף את החידושים האחרונים מחוץ להישג ידם של צוותים קטנים יותר עם פחות משאבים, אך DeepSpeed אפשרה לצוותים הללו להתחרות בשירותים גדולים בהרבה עם חומרה מינימלית. מעבר לעיבוד ענן יכול להפוך אימון בינה מלאכותית לדגמים גדולים לנגישים עוד יותר.
קרא עוד על DeepSpeed ב-Microsoft כאן, וראה את הסימן המסחרי כאן.
באמצעות אלומיניום