Snowflake Arctic se orgulha de ser o "melhor LLM para IA empresarial". Essa é uma grande afirmação

Você pode experimentar o Snowflake no HuggingFace agora

Ícone de tempo de leitura 2 minutos. ler

Ícone do calendário Publicado em 24 de abril de 2024

publicado em 24 de abril de 2024

Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links.

Notas chave

Snowflake apresenta o Arctic, alegando que rivaliza com o Llama 3 70B com custos mais baixos.
A Arctic é excelente em tarefas empresariais como codificação e geração de SQL.
Usando um Dense-MoE Hybrid, o Arctic otimiza a eficiência para vários tamanhos de lote.

Snowflake, uma gigante da computação em nuvem formada inicialmente por ex-cientistas da Oracle, agora está desafiando grandes jogadores na guerra da IA. A empresa lançou Floco de neve Ártico, seu mais recente “melhor LLM para IA corporativa”, e afirmou que é melhor do que o Llama 3 70B e melhor do que a variante 8B deste último.

Em seu anúncio, a Snowflake afirma que o modelo do Ártico corresponde ao desempenho do Llama 3 70B, mas com requisitos e custos de computação mais baixos. É considerado ideal para tarefas de inteligência empresarial em áreas e benchmarks como codificação (HumanEval+ e MBPP+), geração de SQL (Spider) e acompanhamento de instruções (IFEval).

Essa é uma grande afirmação, especialmente considerando que Lhama 3 70B tem tido um bom desempenho contra outros modelos importantes como GPT-4 Turbo e Claude 3 Opus em testes importantes. O próximo modelo da Meta supostamente pontua bem em benchmarks como MMLU (para compreensão de assuntos), GPQA (biologia, física e química e HumanEval (codificação).

Snowflake Arctic mistura um transformador denso de 10B com um MLP MoE de 128 × 3.66B usando um híbrido Dense-MoE. Isso totaliza 480B de parâmetros, mas apenas 17B são usados ativamente, escolhidos com os 2 principais canais.

Para lotes pequenos como 1, o Arctic reduz as leituras de memória em até 4x em comparação com Code-Llama 70B e até 2.5x menos que Mixtral 8x22B. Mas, à medida que o tamanho dos lotes aumenta significativamente, o Ártico torna-se limitado pela computação. Ele exige 4x menos computação do que CodeLlama 70B e Llama 3 70B.

Você pode experimentar o Snowflake Arctic em Abraçando o Rosto. A empresa também promete que o modelo chegará em breve a outros jardins modelo como AWS, Microsoft Azure, Perplexity e muito mais.

Rafly Gilang

Repórter Técnico

Rafly é um repórter com anos de experiência jornalística, abrangendo áreas de tecnologia, negócios, social e cultura. Atualmente reportando notícias sobre produtos, tecnologia e IA relacionados à Microsoft no Windows Report e MSPowerUser. Tem uma dica? Envie para [email protegido].