مایکروسافت Phi-3 Mini را تنها برای یک هفته با پردازندههای گرافیکی H100 انویدیا آموزش داد.
نسخه Mini Phi-3 تنها مدلی است که در حال حاضر موجود است
2 دقیقه خواندن
منتشر شده در
صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب
یادداشت های کلیدی
- مایکروسافت مدل های Phi-3 را به رهبری Phi-3 Mini با پارامترهای 3.8B عرضه کرد.
- این مدل بر روی 3.3 تریلیون توکن در هفت روز با استفاده از 512 پردازنده گرافیکی NVIDIA H100 آموزش داده شد.
- خانواده Phi-3 همچنین شامل انواع کوچک و متوسط است که از مدل های قبلی مانند Phi-2 بهتر عمل می کند.
مایکروسافت راه اندازی کرد خانواده Phi-3 از مدل ها، یکی از بهترین مدل های کوچک موجود در بازار در حال حاضر. و حالا انویدیا گفت: و توضیح داد که چگونه شرکت ردموند از پردازندههای گرافیکی H100 خود برای آموزش این مدلها یا به طور خاصتر، نسخه Mini، 3.8B استفاده کرد.
سازنده فناوری روز سهشنبه میگوید: «این مدل ۳.۸ میلیارد پارامتر دارد و تنها در ۷ روز با ۵۱۲ پردازنده گرافیکی NVIDIA H3.8 Tensor Core روی ۳.۳ تریلیون توکن آموزش داده شد».
خانواده Phi-3 با سه نوع ارائه می شود: Phi-3 Mini (3.8B)، Phi-3 Small (7B) و Phi-3 Medium (14B). این یک پیشرفت عظیم نسبت به قبلی است فی-2 که تنها با 2.7 میلیارد پارامتر ماه پیش راه اندازی شد.
Phi-3 Mini، به طور خاص، همچنین با دو گزینه بسته به توکن های پشتیبانی ارائه می شود: 4K و 128K. می توانید مورد دوم را در مرکز هوش مصنوعی انویدیا به عنوان یک سرویس NIM Nvidia برای توسعه دهندگان امتحان کنید و مدل را به صورت محلی با استفاده از Windows DirectML یا TensorRT-LLM اجرا کنید.
مایکروسافت "مدل های Phi-3 به طور قابل توجهی از مدل های زبانی با اندازه های یکسان و بزرگتر در معیارهای کلیدی بهتر عمل می کنند (به اعداد معیار زیر مراجعه کنید، بالاتر بهتر است) گفت: هنگام عرضه مدل ها، به خود می بالید که نسخه های کوچک و متوسط می توانند از مدل های بزرگتر مانند GPT-3.5T بهتر عمل کنند.
نسخه Mini همان چیزی است که در حال حاضر در بازار موجود است، اما مایکروسافت قول داده است که تمام دو مدل دیگر به زودی در دسترس خواهند بود. همچنین میتوانید Phi-3 Mini را روی هوش مصنوعی Azure و Hugging Face امتحان کنید.