แพลตฟอร์ม AI ที่ใช้ FPGA ขนาดใหญ่ของ Microsoft บรรลุการประมวลผลแบบเรียลไทม์ในระดับศูนย์ข้อมูล

ไอคอนเวลาอ่านหนังสือ 3 นาที. อ่าน


ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา ไอคอนคำแนะนำเครื่องมือ

อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม

วันนี้ Microsoft ได้เปิดเผยข้อมูลเพิ่มเติมเกี่ยวกับเทคโนโลยีที่จะเพิ่มพลังให้กับหุ่นยนต์ซึ่งจะบดขยี้กะโหลกของเราให้อยู่ใต้ส้นเท้า

เรียกว่า Project Brainwave ซึ่งเป็นแพลตฟอร์ม AI บนคลาวด์ของ Microsoft ที่ขับเคลื่อนโดยยูนิต Stratix 14 FPGA ขนาด 10 นาโนเมตรรุ่นใหม่ของ Intel และสามารถส่งมอบ 39.5 Teraflops ที่ยั่งยืน โดยดำเนินการตามคำขอแต่ละรายการภายในเวลาไม่ถึงมิลลิวินาที ประสิทธิภาพสูงและเวลาแฝงที่ต่ำเป็นพิเศษนี้ทำให้ Microsoft ส่งมอบ AI แบบเรียลไทม์ซึ่งมีความสำคัญมากขึ้นเรื่อยๆ เนื่องจากโครงสร้างพื้นฐานระบบคลาวด์ประมวลผลสตรีมข้อมูลสด ไม่ว่าจะเป็นคำค้นหา วิดีโอ สตรีมเซ็นเซอร์ หรือการโต้ตอบกับผู้ใช้

ด้วยการแนบ FPGA ประสิทธิภาพสูงเข้ากับเครือข่ายศูนย์ข้อมูลโดยตรง Microsoft สามารถให้บริการ DNN เป็นไมโครเซอร์วิสของฮาร์ดแวร์ โดยที่ DNN สามารถจับคู่กับพูล FPGA ระยะไกลและเรียกใช้โดยเซิร์ฟเวอร์ที่ไม่มีซอฟต์แวร์ในลูป สถาปัตยกรรมระบบนี้ช่วยลดเวลาแฝง เนื่องจาก CPU ไม่จำเป็นต้องประมวลผลคำขอที่เข้ามา และอนุญาตให้มีปริมาณงานสูงมาก โดยคำขอประมวลผล FPGA จะเร็วเท่าที่เครือข่ายสามารถสตรีมได้

Project Brainwave ใช้หน่วยประมวลผล DNN (หรือ DPU) "แบบอ่อน" ที่ทรงพลัง ซึ่งสังเคราะห์บน FPGA ที่มีจำหน่ายในท้องตลาด ซึ่งรวมทั้งบล็อกการประมวลผลสัญญาณดิจิทัล ASIC บน FPGA และตรรกะที่สังเคราะห์ได้เพื่อให้มีหน่วยการทำงานจำนวนมากขึ้นและเหมาะสมยิ่งขึ้น การใช้เทคนิคแบบกำหนดเองจำนวนหนึ่งทำให้สามารถบรรลุประสิทธิภาพเทียบเท่ากับชิป DPU แบบฮาร์ดโค้ดจำนวนมากหรือมากกว่า

เพื่อช่วยให้นักพัฒนาใช้ประโยชน์จากพลังทั้งหมดนี้ Project Brainwave รวมชุดซอฟต์แวร์ที่ออกแบบมาเพื่อรองรับเฟรมเวิร์กการเรียนรู้เชิงลึกยอดนิยมที่หลากหลาย รองรับ Microsoft Cognitive Toolkit และ Tensorflow ของ Google แล้ว โดยมีแผนจะสนับสนุนส่วนอื่นๆ อีกมากมาย

ระบบได้รับการออกแบบเพื่อแสดงประสิทธิภาพที่แท้จริงในระดับสูงในแบบจำลองที่ซับซ้อนหลากหลาย พร้อมการดำเนินการแบบไม่มีแบตช์ และสามารถจัดการกับโมเดลที่ซับซ้อนและใช้หน่วยความจำมาก เช่น LSTM แบบเรียลไทม์

แม้แต่ในซิลิกอน Stratix 10 รุ่นแรก Microsoft ได้สาธิตระบบ Project Brainwave ที่พอร์ตซึ่งใช้งานโมเดล GRU ขนาดใหญ่ ซึ่งใหญ่กว่า Resnet-50 ถึงห้าเท่า โดยไม่มีการแบ่งกลุ่ม และบรรลุประสิทธิภาพในการตั้งค่าบันทึก การสาธิตใช้รูปแบบทศนิยม 8 บิตแบบกำหนดเองของ Microsoft (“ms-fp8”) ซึ่งไม่สูญเสียความแม่นยำ (โดยเฉลี่ย) ในรุ่นต่างๆ

พวกเขาแสดง Stratix 10 ที่รักษา 39.5 Teraflops บน GRU ขนาดใหญ่นี้ โดยดำเนินการแต่ละคำขอภายในเวลาไม่ถึงหนึ่งมิลลิวินาที ในระดับประสิทธิภาพนั้น สถาปัตยกรรม Brainwave รองรับการประมวลผลมากกว่า 130,000 การประมวลผลต่อรอบ โดยได้รับแรงหนุนจากคำสั่งมาโครหนึ่งคำสั่งที่ออกทุกๆ 10 รอบ Project Brainwave ทำงานบน Stratix 10 บรรลุประสิทธิภาพ AI แบบเรียลไทม์ที่แสดงให้เห็นในระดับที่ไม่เคยมีมาก่อนในโมเดลที่ท้าทายอย่างยิ่ง โดยประสิทธิภาพในปัจจุบันเป็นเพียงจุดเริ่มต้น

Microsoft วางแผนที่จะนำ Project Brainwave มาสู่ Azure ในปี 2018 เพื่อให้ลูกค้าทุกคนสามารถเข้าถึงเทคโนโลยีนี้ ทำให้พวกเขาสามารถใช้โมเดลการเรียนรู้เชิงลึกที่ซับซ้อนที่สุดในประสิทธิภาพการสร้างสถิติ และทำให้ Armageddon เข้าใกล้อีกขั้นหนึ่ง

อ่านรายละเอียดเพิ่มเติมเกี่ยวกับเทคโนโลยี ที่ Microsoft ที่นี่.

ข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อต่างๆ: ai, FPGA, ไมโครซอฟท์, โครงการคลื่นสมอง

เขียนความเห็น

ที่อยู่อีเมลของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมาย *