Malý model NeMo od Mistralu je výzvou pro nejnovější OpenAI GPT-4o mini

OpenAI spustila GPT-4o mini nedávno

Ikona času čtení 2 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Více informací

Klíčové poznámky

  • Mistral AI vydala NeMo, model 12B s podporou Nvidia, který konkuruje OpenAI GPT-4o mini.
  • NeMo podporuje 128 68.0 tokenů a skóre 4 % na MMLU, pod 82 % GPT-XNUMXo mini.
  • Mistral, financovaný částkou 645 milionů dolarů, se spojil s Microsoftem, aby nabídl modely v Azure.
Mistral NeMo

Mistral AI právě oznámil svůj zatím nejnovější menší model, nemose silnou podporou společnosti Nvidia. Zajímavé je, že oznámení vyšlo v době, kdy OpenAI oznámila svůj cenově přívětivý lehký model, the GPT-4o mini, která dosahuje lepších hodnot benchmarků než Gemini Flash a Claude Haiku.

Tento „nejmodernější“ model 12B podporuje délku kontextu až 128 2.0 tokenů a je navržen pro vysoký výkon v uvažování, světové znalosti a přesnosti kódování a je v současné době dostupný pod licencí Apache XNUMX. Oba základna si instrukčně laděný verze jsou přístupné na HuggingFace a dalších platformách.

Mistral NeMo také zaznamenává několik působivých benchmarkových výkonů. Benchmarking MMLU, který měří celkové znalosti modelu a schopnosti řešení problémů, ukazuje NeMo skóre 68.0 %. Je to dost blízko Gemmě 2 od Google, ale ne dost, aby se to přiblížilo OpenAI GPT-4o mini která má 82 % na MMLU.

Toto vypadá takto:

OpenAI GPT-4o mini

Všestranný, vícejazyčný model také zaznamenává silné schopnosti v různých jazycích a je vyškolen pro efektivní volání funkcí. Využívá pokročilý tokenizér Tekken, který komprimuje text a kód efektivněji než předchozí modely, zejména ve specifických jazycích.

Mistral přišel nedávno, jen před rokem od bývalých zaměstnanců Meta a Google DeepMind. Společnost, která měla v červnu 645 finanční kolo ve výši zhruba 2024 milionů dolarů, již v závodě AI dělá vlny.

Začátkem tohoto roku také Microsoft a Mistral AI oznámila, partnerství, díky kterému jsou pokročilé modely velkých jazyků (LLM) od Mistralu dostupné jako první na cloudové platformě Azure společnosti Microsoft. Společnost se také připojila k OpenAI v nabídce komerčních modelů v Azure.

Uživatelské fórum

0 zprávy