Microsoft entrenó al Phi-3 Mini solo durante una semana con las GPU H100 compatibles con IA de Nvidia

La versión Mini de Phi-3 es el único modelo disponible actualmente

Icono de tiempo de lectura 2 minuto. leer


Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces. Icono de información sobre herramientas

Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más

Notas clave

  • Microsoft lanzó los modelos Phi-3, liderados por el Phi-3 Mini con parámetros de 3.8B,
  • El modelo se entrenó con 3.3 billones de tokens en siete días utilizando 512 GPU NVIDIA H100.
  • La familia Phi-3 también incluye variantes Pequeña y Mediana, superando a modelos anteriores como Phi-2.

Microsoft lanzó el familia phi-3 de modelos, uno de los mejores modelos pequeños del mercado actualmente. Y ahora, Nvidia dijo y describió cómo la compañía de Redmond utilizó sus GPU H100 para entrenar estos modelos, o más concretamente, la versión Mini, 3.8B.

"El modelo tiene 3.8 millones de parámetros y fue entrenado con 3.3 billones de tokens en sólo siete días en 512 GPU NVIDIA H100 Tensor Core", dijo el fabricante de tecnología el martes. 

La familia Phi-3 viene con tres variantes: Phi-3 Mini (3.8B), Phi-3 Small (7B) y Phi-3 Medium (14B). Es una mejora enorme con respecto al anterior. fi-2 que se lanzó con sólo 2.7 mil millones de parámetros hace meses. 

Phi-3 Mini, más específicamente, también viene con dos opciones según los tokens compatibles: 4K y 128K. Puede probar este último en el centro de inteligencia artificial de Nvidia como un servicio NIM de Nvidia para desarrolladores y ejecutar el modelo localmente usando Windows DirectML o TensorRT-LLM.

"Los modelos Phi-3 superan significativamente a los modelos de lenguaje del mismo tamaño y de mayor tamaño en puntos de referencia clave (consulte los números de puntos de referencia a continuación, cuanto más alto, mejor)", Microsoft dijo al lanzar los modelos, alardeando de que las versiones Pequeña y Mediana pueden superar a los modelos más grandes como el GPT-3.5T. 

La versión Mini es la que está disponible en el mercado en este momento, pero Microsoft prometió que los otros dos modelos estarán disponibles en breve. También puedes probar Phi-3 Mini en Azure AI y Hugging Face.

Deje un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *