Microsoft entrenó al Phi-3 Mini solo durante una semana con las GPU H100 compatibles con IA de Nvidia
La versión Mini de Phi-3 es el único modelo disponible actualmente
2 minuto. leer
Publicado el
Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más
Notas clave
- Microsoft lanzó los modelos Phi-3, liderados por el Phi-3 Mini con parámetros de 3.8B,
- El modelo se entrenó con 3.3 billones de tokens en siete días utilizando 512 GPU NVIDIA H100.
- La familia Phi-3 también incluye variantes Pequeña y Mediana, superando a modelos anteriores como Phi-2.
Microsoft lanzó el familia phi-3 de modelos, uno de los mejores modelos pequeños del mercado actualmente. Y ahora, Nvidia dijo y describió cómo la compañía de Redmond utilizó sus GPU H100 para entrenar estos modelos, o más concretamente, la versión Mini, 3.8B.
"El modelo tiene 3.8 millones de parámetros y fue entrenado con 3.3 billones de tokens en sólo siete días en 512 GPU NVIDIA H100 Tensor Core", dijo el fabricante de tecnología el martes.
La familia Phi-3 viene con tres variantes: Phi-3 Mini (3.8B), Phi-3 Small (7B) y Phi-3 Medium (14B). Es una mejora enorme con respecto al anterior. fi-2 que se lanzó con sólo 2.7 mil millones de parámetros hace meses.
Phi-3 Mini, más específicamente, también viene con dos opciones según los tokens compatibles: 4K y 128K. Puede probar este último en el centro de inteligencia artificial de Nvidia como un servicio NIM de Nvidia para desarrolladores y ejecutar el modelo localmente usando Windows DirectML o TensorRT-LLM.
"Los modelos Phi-3 superan significativamente a los modelos de lenguaje del mismo tamaño y de mayor tamaño en puntos de referencia clave (consulte los números de puntos de referencia a continuación, cuanto más alto, mejor)", Microsoft dijo al lanzar los modelos, alardeando de que las versiones Pequeña y Mediana pueden superar a los modelos más grandes como el GPT-3.5T.
La versión Mini es la que está disponible en el mercado en este momento, pero Microsoft prometió que los otros dos modelos estarán disponibles en breve. También puedes probar Phi-3 Mini en Azure AI y Hugging Face.