Microsoft ฝึกอบรม Phi-3 Mini เพียงหนึ่งสัปดาห์ด้วย GPU H100 ที่เป็นมิตรกับ AI ของ Nvidia

รุ่น Mini ของ Phi-3 เป็นรุ่นเดียวที่มีอยู่ในปัจจุบัน

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน


ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา ไอคอนคำแนะนำเครื่องมือ

อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม

หมายเหตุสำคัญ

  • Microsoft เปิดตัวรุ่น Phi-3 นำโดย Phi-3 Mini พร้อมพารามิเตอร์ 3.8B
  • โมเดลดังกล่าวได้รับการฝึกฝนเกี่ยวกับโทเค็น 3.3 ล้านล้านโทเค็นในเจ็ดวันโดยใช้ GPU NVIDIA H512 จำนวน 100 ตัว
  • ครอบครัว Phi-3 ยังมีรุ่นขนาดเล็กและขนาดกลาง ซึ่งมีประสิทธิภาพเหนือกว่ารุ่นก่อนหน้า เช่น Phi-2

Microsoft เปิดตัว ครอบครัวพี-3 ของรุ่นหนึ่งในรุ่นเล็กที่ดีที่สุดในตลาดขณะนี้ และตอนนี้ NVIDIA กล่าวว่า และอธิบายว่าบริษัท Redmond ใช้ GPU H100 เพื่อฝึกโมเดลเหล่านี้หรือโดยเฉพาะอย่างยิ่งรุ่น Mini 3.8B ได้อย่างไร

“โมเดลนี้มีพารามิเตอร์ 3.8 พันล้านพารามิเตอร์และได้รับการฝึกอบรมเกี่ยวกับโทเค็น 3.3 ล้านล้านโทเค็นในเวลาเพียงเจ็ดวันบน GPU NVIDIA H512 Tensor Core จำนวน 100 ตัว” ผู้ผลิตเทคโนโลยีกล่าวเมื่อวันอังคาร 

ตระกูล Phi-3 มาพร้อมกับสามรุ่น: Phi-3 Mini (3.8B), Phi-3 Small (7B) และ Phi-3 Medium (14B) เป็นการปรับปรุงครั้งใหญ่จากครั้งก่อน พี-2 ที่เปิดตัวด้วยพารามิเตอร์เพียง 2.7B เมื่อหลายเดือนก่อน 

โดยเฉพาะอย่างยิ่ง Phi-3 Mini ยังมาพร้อมกับสองตัวเลือกขึ้นอยู่กับโทเค็นที่รองรับ: 4K และ 128K คุณสามารถลองอย่างหลังได้ที่ศูนย์ AI ของ Nvidia ในฐานะบริการ Nvidia NIM สำหรับนักพัฒนา และรันโมเดลในเครื่องโดยใช้ Windows DirectML หรือ TensorRT-LLM

“โมเดล Phi-3 มีประสิทธิภาพเหนือกว่าโมเดลภาษาที่มีขนาดเท่ากันและใหญ่กว่าอย่างเห็นได้ชัดในการวัดประสิทธิภาพที่สำคัญ (ดูตัวเลขการวัดประสิทธิภาพด้านล่าง ยิ่งสูงยิ่งดี)” Microsoft กล่าวว่า เมื่อเปิดตัวรุ่นต่างๆ อวดว่า รุ่น Small และ Medium สามารถแซงหน้ารุ่นใหญ่อย่าง GPT-3.5T ได้ 

รุ่น Mini คือรุ่นที่มีอยู่ในตลาดในขณะนี้ แต่ Microsoft สัญญาว่าอีกสองรุ่นจะวางจำหน่ายในไม่ช้า คุณยังสามารถลองใช้ Phi-3 Mini บน Azure AI และ Hugging Face ได้