Microsoft เครื่องหมายการค้า DeepSpeed ห้องสมุด AI 1 ล้านล้านพารามิเตอร์
2 นาที. อ่าน
เผยแพร่เมื่อ
อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม
Microsoft ได้ยื่นขอเครื่องหมายการค้าสำหรับ DeepSpeed ซึ่งเป็นไลบรารี AI ที่ได้รับการปรับปรุง ซึ่งช่วยให้สามารถฝึกอบรมโมเดล AI ขนาดใหญ่บนฮาร์ดแวร์ขนาดเล็กได้
เครื่องหมายการค้าที่ยื่นเมื่อวันที่ 8 ธันวาคม 2020 อ้างอิงถึง “ให้การใช้ซอฟต์แวร์คอมพิวเตอร์ออนไลน์แบบดาวน์โหลดไม่ได้ชั่วคราวสำหรับการประมวลผลปัญญาประดิษฐ์และการเรียนรู้เชิงลึก” แนะนำว่า Microsoft อาจกำลังคิดที่จะให้บริการ DeepSpeed ผ่านบริการคลาวด์ออนไลน์
DeepSpeed ซึ่งเปิดตัวในเดือนกุมภาพันธ์ปีนี้ เป็นไลบรารี Python ที่ช่วยให้สามารถสร้างโมเดลการเรียนรู้เชิงลึกที่มีพารามิเตอร์หลายล้านล้านพารามิเตอร์ มากกว่ารุ่นที่ใหญ่ที่สุดในโลกในปัจจุบันถึงห้าเท่า โดยใช้การ์ดกราฟิก Nvidia V800 เพียง 100 ตัว หากไม่มี DeepSpeed งานเดียวกันจะต้องใช้ Nvidia A4,000 จำนวน 100 เครื่อง ซึ่งเร็วกว่า V2.5 ถึง 100 เท่า และใช้งานได้นาน 100 วัน
เครื่องมือนี้มีประโยชน์อย่างยิ่งหลังจาก GPT-3 แสดงให้เห็นว่าโมเดลยังคงปรับปรุงโครงข่ายประสาทและชุดข้อมูลที่มีขนาดใหญ่ขึ้นต่อไป อย่างไรก็ตาม สิ่งนี้คุกคามที่จะผลักดันนวัตกรรมล่าสุดให้พ้นมือทีมขนาดเล็กที่มีทรัพยากรน้อยกว่า แต่ DeepSpeed ได้อนุญาตให้ทีมเหล่านี้แข่งขันกับบริการที่มีขนาดใหญ่กว่ามากโดยใช้ฮาร์ดแวร์เพียงเล็กน้อย การย้ายไปสู่การประมวลผลแบบคลาวด์อาจทำให้การฝึกอบรม AI แบบจำลองขนาดใหญ่สามารถเข้าถึงได้มากขึ้น
อ่านเพิ่มเติมเกี่ยวกับ DeepSpeed ที่ Microsoft โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติมและดูเครื่องหมายการค้า โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.
ผ่านทาง อลูเมีย