Snowflake Arctic sa pýši „najlepšou LLM pre podnikovú AI“. To je dosť veľký nárok

Snowflake si teraz môžete vyskúšať na HuggingFace

Ikona času čítania 2 min. čítať


Čítačky pomáhajú podporovať MSpoweruser. Ak nakupujete prostredníctvom našich odkazov, môžeme získať províziu. Ikona popisu

Prečítajte si našu informačnú stránku a zistite, ako môžete pomôcť MSPoweruser udržať redakčný tím Čítaj viac

Kľúčové poznámky

  • Snowflake predstavuje Arctic a tvrdí, že súperí s Llama 3 70B s nižšími nákladmi.
  • Arctic vyniká v podnikových úlohách, ako je kódovanie a generovanie SQL.
  • Použitím Dense-MoE Hybrid, Arctic optimalizuje účinnosť pre rôzne veľkosti dávok.

Snowflake, gigant v oblasti cloud computingu, ktorý pôvodne vytvorili bývalí vedci Oracle, teraz vyzýva veľkých hráčov vo vojne AI. Spoločnosť spustila Arktická snehová vločka, jeho najnovší „najlepší LLM pre podnikovú AI“ a tvrdil, že je lepší ako na rovnakej úrovni ako Llama 3 70B a lepší ako jeho 8B variant.

Snowflake vo svojom oznámení tvrdí, že model Arctic zodpovedá výkonu Llama 3 70B, ale s nižšími výpočtovými požiadavkami a nákladmi. Je propagovaný ako ideálny pre úlohy podnikovej inteligencie v oblastiach a benchmarkoch, ako je kódovanie (HumanEval+ a MBPP+), generovanie SQL (Spider) a sledovanie inštrukcií (IFEval).

To je veľké tvrdenie, najmä vzhľadom na to Lama 3 70B sa v dôležitých testoch darilo aj iným hlavným modelom ako GPT-4 Turbo a Claude 3 Opus. Pripravovaný model Meta údajne dosahuje dobré výsledky v benchmarkoch ako MMLU (pre pochopenie predmetov), ​​GPQA (biológia, fyzika a chémia a HumanEval (kódovanie).

Snowflake Arctic zmiešava 10B hustý transformátor s 128×3.66B MoE MLP pomocou Dense-MoE Hybrid. Celkovo je to 480B parametrov, ale aktívne sa používa iba 17B, ktoré sú vybrané s top-2 hradlovaním. 

V prípade malých dávok, ako je 1, Arctic znižuje čítanie pamäte až 4x v porovnaní s Code-Llama 70B a až 2.5x menej ako Mixtral 8x22B. Keď sa však veľkosť dávok výrazne zvýši, Arktída sa stáva viazanou na výpočty. Vyžaduje 4x menej výpočtovej techniky ako CodeLlama 70B a Llama 3 70B.

Môžete vyskúšať Snowflake Arctic HuggingFace. Spoločnosť tiež sľubuje, že model čoskoro dorazí na ďalšie modelové záhrady, ako sú AWS, Microsoft Azure, Perplexity a ďalšie.