Microsoft เครื่องหมายการค้า DeepSpeed ​​ห้องสมุด AI 1 ล้านล้านพารามิเตอร์

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน


ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา ไอคอนคำแนะนำเครื่องมือ

อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม

ความเร็วลึก

Microsoft ได้ยื่นขอเครื่องหมายการค้าสำหรับ DeepSpeed ​​ซึ่งเป็นไลบรารี AI ที่ได้รับการปรับปรุง ซึ่งช่วยให้สามารถฝึกอบรมโมเดล AI ขนาดใหญ่บนฮาร์ดแวร์ขนาดเล็กได้

เครื่องหมายการค้าที่ยื่นเมื่อวันที่ 8 ธันวาคม 2020 อ้างอิงถึง “ให้การใช้ซอฟต์แวร์คอมพิวเตอร์ออนไลน์แบบดาวน์โหลดไม่ได้ชั่วคราวสำหรับการประมวลผลปัญญาประดิษฐ์และการเรียนรู้เชิงลึก” แนะนำว่า Microsoft อาจกำลังคิดที่จะให้บริการ DeepSpeed ​​ผ่านบริการคลาวด์ออนไลน์

DeepSpeed ​​ซึ่งเปิดตัวในเดือนกุมภาพันธ์ปีนี้ เป็นไลบรารี Python ที่ช่วยให้สามารถสร้างโมเดลการเรียนรู้เชิงลึกที่มีพารามิเตอร์หลายล้านล้านพารามิเตอร์ มากกว่ารุ่นที่ใหญ่ที่สุดในโลกในปัจจุบันถึงห้าเท่า โดยใช้การ์ดกราฟิก Nvidia V800 เพียง 100 ตัว หากไม่มี DeepSpeed ​​งานเดียวกันจะต้องใช้ Nvidia A4,000 จำนวน 100 เครื่อง ซึ่งเร็วกว่า V2.5 ถึง 100 เท่า และใช้งานได้นาน 100 วัน

เครื่องมือนี้มีประโยชน์อย่างยิ่งหลังจาก GPT-3 แสดงให้เห็นว่าโมเดลยังคงปรับปรุงโครงข่ายประสาทและชุดข้อมูลที่มีขนาดใหญ่ขึ้นต่อไป อย่างไรก็ตาม สิ่งนี้คุกคามที่จะผลักดันนวัตกรรมล่าสุดให้พ้นมือทีมขนาดเล็กที่มีทรัพยากรน้อยกว่า แต่ DeepSpeed ​​​​ได้อนุญาตให้ทีมเหล่านี้แข่งขันกับบริการที่มีขนาดใหญ่กว่ามากโดยใช้ฮาร์ดแวร์เพียงเล็กน้อย การย้ายไปสู่การประมวลผลแบบคลาวด์อาจทำให้การฝึกอบรม AI แบบจำลองขนาดใหญ่สามารถเข้าถึงได้มากขึ้น

อ่านเพิ่มเติมเกี่ยวกับ DeepSpeed ​​ที่ Microsoft โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติมและดูเครื่องหมายการค้า โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

ผ่านทาง อลูเมีย