پلت فرم عظیم هوش مصنوعی مبتنی بر FPGA مایکروسافت به پردازش بلادرنگ در مقیاس مرکز داده دست می یابد
3 دقیقه خواندن
منتشر شده در
صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب
مایکروسافت امروز اطلاعات بیشتری در مورد فناوری ارائه کرد که در نهایت به رباتهایی که جمجمههای ما را زیر پاشنه خود خرد میکنند، نیرو میدهد.
پلتفرم هوش مصنوعی مبتنی بر ابر مایکروسافت که Project Brainwave نام دارد، از واحدهای 14 نانومتری Stratix 10 FPGA جدید اینتل پشتیبانی میکند و قادر به ارائه 39.5 ترافلاپس پایدار است و هر درخواست را در کمتر از یک میلیثانیه اجرا میکند. این کارایی بالا و تأخیر بسیار کم به مایکروسافت اجازه میدهد هوش مصنوعی را در زمان واقعی ارائه دهد که با پردازش زیرساختهای ابری جریانهای زنده دادهها، خواه عبارتهای جستجو، ویدیو، جریان حسگر یا تعامل با کاربران، اهمیت فزایندهای پیدا میکند.
مایکروسافت با اتصال FPGA با کارایی بالا به طور مستقیم به شبکه مرکز داده خود، می تواند DNN ها را به عنوان ریزسرویس های سخت افزاری ارائه کند، که در آن یک DNN می تواند به مجموعه ای از FPGA های راه دور نگاشت شود و توسط سروری که نرم افزاری در حلقه وجود ندارد فراخوانی شود. این معماری سیستم هم تأخیر را کاهش میدهد، زیرا CPU نیازی به پردازش درخواستهای دریافتی ندارد و هم با پردازش درخواستهای FPGA به همان سرعتی که شبکه میتواند آنها را استریم کند، توان عملیاتی بسیار بالایی را فراهم میکند.
Project Brainwave از یک واحد پردازش DNN (یا DPU) قدرتمند "نرم" استفاده می کند که روی FPGA های تجاری موجود سنتز شده است که هم بلوک های پردازش سیگنال دیجیتال ASIC در FPGA ها و هم منطق قابل سنتز را برای ارائه تعداد بیشتر و بهینه تری از واحدهای عملکردی ترکیب می کند. با استفاده از تعدادی از تکنیک های سفارشی، می توان عملکردی قابل مقایسه با - یا بیشتر از - بسیاری از تراشه های DPU رمزگذاری شده را به دست آورد.
برای کمک به توسعه دهندگان در استفاده از این همه قدرت، Project Brainwave یک پشته نرم افزار طراحی شده برای پشتیبانی از طیف گسترده ای از چارچوب های یادگیری عمیق محبوب را ترکیب می کند. در حال حاضر از Microsoft Cognitive Toolkit و Google's Tensorflow پشتیبانی میکند و برنامههایی برای پشتیبانی از بسیاری دیگر نیز دارد.
این سیستم به گونهای طراحی شده است که عملکرد واقعی بالایی را در طیف گستردهای از مدلهای پیچیده، با اجرای بدون دسته، نشان دهد و میتواند مدلهای پیچیده و پرحافظه مانند LSTM را در زمان واقعی مدیریت کند.
حتی در سیلیکون اولیه Stratix 10، مایکروسافت سیستم Project Brainwave پورت شده را نشان داد که یک مدل بزرگ GRU - پنج برابر بزرگتر از Resnet-50 - بدون بچینگ اجرا میکرد و به عملکرد رکوردی دست یافت. در نسخه ی نمایشی از فرمت ممیز شناور 8 بیتی سفارشی مایکروسافت ("ms-fp8") استفاده شد که در طیف وسیعی از مدل ها از دقت (به طور متوسط) افت نمی کند.
آنها Stratix 10 را نشان دادند که 39.5 ترافلاپس را در این GRU بزرگ نگه می دارد و هر درخواست را در کمتر از یک میلی ثانیه اجرا می کند. در آن سطح از عملکرد، معماری Brainwave اجرای بیش از 130,000 عملیات محاسباتی در هر چرخه را حفظ میکند که توسط یک دستور کلان که در هر 10 چرخه صادر میشود هدایت میشود. پروژه Brainwave با اجرای Stratix 10 به سطوح بیسابقهای از عملکرد بیسابقه هوش مصنوعی در مدلهای بسیار چالشبرانگیز دست یافت و عملکرد امروز تنها یک نقطه شروع است.
مایکروسافت قصد دارد Project Brainwave را در سال 2018 به Azure بیاورد تا هر مشتری بتواند به این فناوری دسترسی پیدا کند و به آنها اجازه دهد پیچیده ترین مدل های یادگیری عمیق خود را با عملکرد رکورددار اجرا کنند و Armageddon را یک قدم به آن نزدیکتر کند.
جزئیات بیشتر در مورد فناوری را بخوانید در مایکروسافت اینجا هست.