Snowflake Arctic se orgulha de ser o "melhor LLM para IA empresarial". Essa é uma grande afirmação

Você pode experimentar o Snowflake no HuggingFace agora

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Notas chave

  • Snowflake apresenta o Arctic, alegando que rivaliza com o Llama 3 70B com custos mais baixos.
  • A Arctic é excelente em tarefas empresariais como codificação e geração de SQL.
  • Usando um Dense-MoE Hybrid, o Arctic otimiza a eficiência para vários tamanhos de lote.

Snowflake, uma gigante da computação em nuvem formada inicialmente por ex-cientistas da Oracle, agora está desafiando grandes jogadores na guerra da IA. A empresa lançou Floco de neve Ártico, seu mais recente “melhor LLM para IA corporativa”, e afirmou que é melhor do que o Llama 3 70B e melhor do que a variante 8B deste último.

Em seu anúncio, a Snowflake afirma que o modelo do Ártico corresponde ao desempenho do Llama 3 70B, mas com requisitos e custos de computação mais baixos. É considerado ideal para tarefas de inteligência empresarial em áreas e benchmarks como codificação (HumanEval+ e MBPP+), geração de SQL (Spider) e acompanhamento de instruções (IFEval).

Essa é uma grande afirmação, especialmente considerando que Lhama 3 70B tem tido um bom desempenho contra outros modelos importantes como GPT-4 Turbo e Claude 3 Opus em testes importantes. O próximo modelo da Meta supostamente pontua bem em benchmarks como MMLU (para compreensão de assuntos), GPQA (biologia, física e química e HumanEval (codificação).

Snowflake Arctic mistura um transformador denso de 10B com um MLP MoE de 128 × 3.66B usando um híbrido Dense-MoE. Isso totaliza 480B de parâmetros, mas apenas 17B são usados ​​ativamente, escolhidos com os 2 principais canais. 

Para lotes pequenos como 1, o Arctic reduz as leituras de memória em até 4x em comparação com Code-Llama 70B e até 2.5x menos que Mixtral 8x22B. Mas, à medida que o tamanho dos lotes aumenta significativamente, o Ártico torna-se limitado pela computação. Ele exige 4x menos computação do que CodeLlama 70B e Llama 3 70B.

Você pode experimentar o Snowflake Arctic em Abraçando o Rosto. A empresa também promete que o modelo chegará em breve a outros jardins modelo como AWS, Microsoft Azure, Perplexity e muito mais.