Snowflake Arctic on ylpeä "yritysten tekoälyn parhaana LLM:nä". Se on aika iso väite

Voit kokeilla Snowflakea HuggingFacessa nyt

Lukuajan kuvake 2 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Keskeiset huomautukset

  • Snowflake esittelee Arcticin väittäen kilpailevan Llama 3 70B:n kanssa alhaisemmilla kustannuksilla.
  • Arctic on erinomainen yritystehtävissä, kuten koodauksessa ja SQL:n luomisessa.
  • Dense-MoE-hybridin avulla Arctic optimoi tehokkuuden eri erikokoisille erille.

Snowflake, entisten Oraclen tutkijoiden alun perin perustama pilvilaskentajätti, haastaa nyt suuret pelaajat tekoälysodassa. Yritys käynnisti Arktinen lumihiutale, sen uusin "paras LLM yritysten tekoälylle" ja väitti, että se on parempi kuin Llama 3 70B:n tasolla ja parempi kuin jälkimmäisen 8B-versio.

Ilmoituksessaan Snowflake väittää, että Arctic-malli vastaa Llama 3 70B:n suorituskykyä, mutta alhaisemmilla laskentavaatimuksilla ja kustannuksilla. Sitä mainostetaan ihanteellisena yritystiedon tehtäviin sellaisilla aloilla ja vertailuissa kuin koodaus (HumanEval+ ja MBPP+ ), SQL:n luominen (Spider) ja ohjeiden seuraaminen (IFEval).

Se on iso väite, varsinkin kun ottaa huomioon Laama 3 70B on menestynyt hyvin muita suuria malleja, kuten GPT-4 Turboa ja Claude 3 Opusta, vastaan ​​tärkeissä testeissä. Metan tuleva malli on kuulemma menestynyt hyvin vertailuissa, kuten MMLU (aiheiden ymmärtämiseen), GPQA (biologia, fysiikka ja kemia) ja HumanEval (koodaus).

Snowflake Arctic sekoittaa 10 B tiheän muuntajan 128 × 3.66 B MoE MLP: n kanssa käyttämällä Dense-MoE hybridiä. Tämä on yhteensä 480B parametria, mutta vain 17B on aktiivisessa käytössä, valittu top-2-portauksella. 

Pienissä eräkokoissa, kuten 1, Arctic vähentää muistin lukumääriä jopa 4x Code-Llama 70B:hen verrattuna ja jopa 2.5x vähemmän kuin Mixtral 8x22B. Mutta kun eräkoko kasvaa merkittävästi, arktinen alue muuttuu laskentaan sidottuksi. Se vaatii neljä kertaa vähemmän tietojenkäsittelyä kuin CodeLlama 4B ja Llama 70 3B.

Voit kokeilla Snowflake Arcticia HalaaKasvot. Yhtiö lupaa myös, että malli saapuu pian muihin mallipuutarhoihin, kuten AWS, Microsoft Azure, Perplexity ja muihin.