Snowflake Arctic se orgulha de ser o "melhor LLM para IA empresarial". Essa é uma grande afirmação
Você pode experimentar o Snowflake no HuggingFace agora
2 minutos. ler
Publicado em
Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais
Notas chave
- Snowflake apresenta o Arctic, alegando que rivaliza com o Llama 3 70B com custos mais baixos.
- A Arctic é excelente em tarefas empresariais como codificação e geração de SQL.
- Usando um Dense-MoE Hybrid, o Arctic otimiza a eficiência para vários tamanhos de lote.
Snowflake, uma gigante da computação em nuvem formada inicialmente por ex-cientistas da Oracle, agora está desafiando grandes jogadores na guerra da IA. A empresa lançou Floco de neve Ártico, seu mais recente “melhor LLM para IA corporativa”, e afirmou que é melhor do que o Llama 3 70B e melhor do que a variante 8B deste último.
Em seu anúncio, a Snowflake afirma que o modelo do Ártico corresponde ao desempenho do Llama 3 70B, mas com requisitos e custos de computação mais baixos. É considerado ideal para tarefas de inteligência empresarial em áreas e benchmarks como codificação (HumanEval+ e MBPP+), geração de SQL (Spider) e acompanhamento de instruções (IFEval).
Essa é uma grande afirmação, especialmente considerando que Lhama 3 70B tem tido um bom desempenho contra outros modelos importantes como GPT-4 Turbo e Claude 3 Opus em testes importantes. O próximo modelo da Meta supostamente pontua bem em benchmarks como MMLU (para compreensão de assuntos), GPQA (biologia, física e química e HumanEval (codificação).
Snowflake Arctic mistura um transformador denso de 10B com um MLP MoE de 128 × 3.66B usando um híbrido Dense-MoE. Isso totaliza 480B de parâmetros, mas apenas 17B são usados ativamente, escolhidos com os 2 principais canais.
Para lotes pequenos como 1, o Arctic reduz as leituras de memória em até 4x em comparação com Code-Llama 70B e até 2.5x menos que Mixtral 8x22B. Mas, à medida que o tamanho dos lotes aumenta significativamente, o Ártico torna-se limitado pela computação. Ele exige 4x menos computação do que CodeLlama 70B e Llama 3 70B.
Você pode experimentar o Snowflake Arctic em Abraçando o Rosto. A empresa também promete que o modelo chegará em breve a outros jardins modelo como AWS, Microsoft Azure, Perplexity e muito mais.