A Microsoft treinou Phi-3 Mini apenas por uma semana com GPUs H100 compatíveis com IA da Nvidia

A versão Mini do Phi-3 é o único modelo disponível atualmente

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Notas chave

  • A Microsoft lançou os modelos Phi-3, liderados pelo Phi-3 Mini com parâmetros de 3.8B,
  • O modelo foi treinado em 3.3 trilhões de tokens em sete dias usando 512 GPUs NVIDIA H100.
  • A família Phi-3 também inclui variantes Pequena e Média, superando modelos anteriores como Phi-2.

Microsoft lançou o Família Phi-3 de modelos, um dos melhores modelos pequenos do mercado no momento. E agora, Nvidia dito e descreveu como a empresa de Redmond usou suas GPUs H100 para treinar esses modelos, ou mais especificamente, a versão Mini, 3.8B.

“O modelo tem 3.8 bilhões de parâmetros e foi treinado em 3.3 trilhões de tokens em apenas sete dias em 512 GPUs NVIDIA H100 Tensor Core”, disse o fabricante de tecnologia na terça-feira. 

A família Phi-3 vem com três variantes: Phi-3 Mini (3.8B), Phi-3 Small (7B) e Phi-3 Medium (14B). É uma grande melhoria em relação ao anterior Phi-2 que foi lançado com apenas 2.7 bilhões de parâmetros meses atrás. 

Phi-3 Mini, mais especificamente, também vem com duas opções dependendo dos tokens de suporte: 4K e 128K. Você pode experimentar o último no centro de IA da Nvidia como um serviço Nvidia NIM para desenvolvedores e executar o modelo localmente usando Windows DirectML ou TensorRT-LLM.

“Os modelos Phi-3 superam significativamente os modelos de linguagem de tamanhos iguais e maiores nos principais benchmarks (veja os números de benchmark abaixo, quanto maior, melhor)”, Microsoft dito ao lançar os modelos, gabando-se de que as versões Pequena e Média podem superar modelos maiores como o GPT-3.5T. 

A versão Mini é a que está disponível no mercado no momento, mas a Microsoft prometeu que todos os outros dois modelos estarão disponíveis em breve. Você também pode experimentar o Phi-3 Mini no Azure AI e no Hugging Face.

Deixe um comentário

O seu endereço de e-mail não será publicado. Os campos obrigatórios são marcados com *