مایکروسافت علامت تجاری DeepSpeed، کتابخانه هوش مصنوعی 1 تریلیون پارامتری خود را نشان می دهد

نماد زمان خواندن 2 دقیقه خواندن


خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم. نماد راهنمای ابزار

صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب

سرعت عمیق

مایکروسافت برای یک علامت تجاری برای DeepSpeed ​​درخواست داده است، کتابخانه هوش مصنوعی بهینه شده آنها که امکان آموزش مدل های هوش مصنوعی در مقیاس بزرگ را بر روی سخت افزار متوسط ​​فراهم می کند.

علامت تجاری، ثبت شده در 8 دسامبر 2020، به "ارائه استفاده موقت از نرم افزار کامپیوتری غیر قابل دانلود آنلاین برای پردازش هوش مصنوعی و یادگیری عمیق،این نشان می دهد که مایکروسافت ممکن است به فکر ارائه DeepSpeed ​​از طریق یک سرویس ابری آنلاین باشد.

DeepSpeed ​​که در فوریه امسال منتشر شد، یک کتابخانه پایتون است که تنها با استفاده از 800 کارت گرافیک Nvidia V100، امکان ایجاد مدل‌های یادگیری عمیق با تریلیون پارامتر، بیش از پنج برابر بزرگترین مدل کنونی جهان را فراهم می‌کند. بدون DeepSpeed، همان کار به 4,000 انویدیا A100 نیاز دارد که تا 2.5 برابر سریعتر از V100 هستند و به مدت 100 روز کار می کنند.

این ابزار به ویژه پس از اینکه GPT-3 نشان داد که مدل‌ها به بهبود شبکه عصبی و مجموعه داده‌ها ادامه می‌دهند بسیار مفید است. با این حال، این تهدیدی بود که جدیدترین نوآوری‌ها را از دسترس تیم‌های کوچک‌تر با منابع کمتر دور کند، اما DeepSpeed ​​به این تیم‌ها اجازه داد تا با خدمات بسیار بزرگ‌تر با حداقل سخت‌افزار رقابت کنند. حرکت به سمت پردازش ابری می تواند آموزش هوش مصنوعی مدل های بزرگ را حتی بیشتر در دسترس قرار دهد.

درباره DeepSpeed ​​در مایکروسافت بیشتر بخوانید اینجا کلیک نمایید، و علامت تجاری را ببینید اینجا کلیک نمایید.

از طريق آلومیا