مایکروسافت علامت تجاری DeepSpeed، کتابخانه هوش مصنوعی 1 تریلیون پارامتری خود را نشان می دهد
2 دقیقه خواندن
منتشر شده در
صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب
مایکروسافت برای یک علامت تجاری برای DeepSpeed درخواست داده است، کتابخانه هوش مصنوعی بهینه شده آنها که امکان آموزش مدل های هوش مصنوعی در مقیاس بزرگ را بر روی سخت افزار متوسط فراهم می کند.
علامت تجاری، ثبت شده در 8 دسامبر 2020، به "ارائه استفاده موقت از نرم افزار کامپیوتری غیر قابل دانلود آنلاین برای پردازش هوش مصنوعی و یادگیری عمیق،این نشان می دهد که مایکروسافت ممکن است به فکر ارائه DeepSpeed از طریق یک سرویس ابری آنلاین باشد.
DeepSpeed که در فوریه امسال منتشر شد، یک کتابخانه پایتون است که تنها با استفاده از 800 کارت گرافیک Nvidia V100، امکان ایجاد مدلهای یادگیری عمیق با تریلیون پارامتر، بیش از پنج برابر بزرگترین مدل کنونی جهان را فراهم میکند. بدون DeepSpeed، همان کار به 4,000 انویدیا A100 نیاز دارد که تا 2.5 برابر سریعتر از V100 هستند و به مدت 100 روز کار می کنند.
این ابزار به ویژه پس از اینکه GPT-3 نشان داد که مدلها به بهبود شبکه عصبی و مجموعه دادهها ادامه میدهند بسیار مفید است. با این حال، این تهدیدی بود که جدیدترین نوآوریها را از دسترس تیمهای کوچکتر با منابع کمتر دور کند، اما DeepSpeed به این تیمها اجازه داد تا با خدمات بسیار بزرگتر با حداقل سختافزار رقابت کنند. حرکت به سمت پردازش ابری می تواند آموزش هوش مصنوعی مدل های بزرگ را حتی بیشتر در دسترس قرار دهد.
درباره DeepSpeed در مایکروسافت بیشتر بخوانید اینجا کلیک نمایید، و علامت تجاری را ببینید اینجا کلیک نمایید.
از طريق آلومیا