A Microsoft treinou Phi-3 Mini apenas por uma semana com GPUs H100 compatíveis com IA da Nvidia
A versão Mini do Phi-3 é o único modelo disponível atualmente
2 minutos. ler
Publicado em
Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais
Notas chave
- A Microsoft lançou os modelos Phi-3, liderados pelo Phi-3 Mini com parâmetros de 3.8B,
- O modelo foi treinado em 3.3 trilhões de tokens em sete dias usando 512 GPUs NVIDIA H100.
- A família Phi-3 também inclui variantes Pequena e Média, superando modelos anteriores como Phi-2.
Microsoft lançou o Família Phi-3 de modelos, um dos melhores modelos pequenos do mercado no momento. E agora, Nvidia dito e descreveu como a empresa de Redmond usou suas GPUs H100 para treinar esses modelos, ou mais especificamente, a versão Mini, 3.8B.
“O modelo tem 3.8 bilhões de parâmetros e foi treinado em 3.3 trilhões de tokens em apenas sete dias em 512 GPUs NVIDIA H100 Tensor Core”, disse o fabricante de tecnologia na terça-feira.
A família Phi-3 vem com três variantes: Phi-3 Mini (3.8B), Phi-3 Small (7B) e Phi-3 Medium (14B). É uma grande melhoria em relação ao anterior Phi-2 que foi lançado com apenas 2.7 bilhões de parâmetros meses atrás.
Phi-3 Mini, mais especificamente, também vem com duas opções dependendo dos tokens de suporte: 4K e 128K. Você pode experimentar o último no centro de IA da Nvidia como um serviço Nvidia NIM para desenvolvedores e executar o modelo localmente usando Windows DirectML ou TensorRT-LLM.
“Os modelos Phi-3 superam significativamente os modelos de linguagem de tamanhos iguais e maiores nos principais benchmarks (veja os números de benchmark abaixo, quanto maior, melhor)”, Microsoft dito ao lançar os modelos, gabando-se de que as versões Pequena e Média podem superar modelos maiores como o GPT-3.5T.
A versão Mini é a que está disponível no mercado no momento, mas a Microsoft prometeu que todos os outros dois modelos estarão disponíveis em breve. Você também pode experimentar o Phi-3 Mini no Azure AI e no Hugging Face.