Mistralov majhen model NeMo izziva najnovejši OpenAI GPT-4o mini

OpenAI je ne tako dolgo nazaj predstavil GPT-4o mini

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

Ključne opombe

  • Mistral AI je izdal NeMo, model 12B s podporo Nvidie, ki konkurira GPT-4o mini OpenAI.
  • NeMo podpira 128k žetonov in dosega 68.0 % na MMLU, pod 4 % GPT-82o mini.
  • Mistral, financiran s 645 milijoni dolarjev, je sodeloval z Microsoftom, da bi ponudil modele na Azure.
Mistral NeMo

Mistral AI je pravkar objavil svoj najnovejši manjši model, nemo, z močno podporo Nvidie. Zanimivo je, da je bila objava objavljena, ko je OpenAI objavil svoj cenovno ugoden lahek model GPT-4o mini, ki dosega boljše referenčne številke kot Gemini Flash in Claude Haiku.

Ta »najsodobnejši« model 12B podpira dolžino konteksta do 128k žetonov in je zasnovan za visoko zmogljivost pri razmišljanju, poznavanju sveta in natančnosti kodiranja in je trenutno na voljo pod licenco Apache 2.0. Oboje baza in uglašen z navodili različice so dostopne na HuggingFace in drugih platformah.

Mistralov NeMo beleži tudi nekaj impresivnih meril uspešnosti. Primerjalna analiza MMLU, ki meri celotno znanje modela in zmožnosti reševanja problemov, kaže, da je NeMo dosegel 68.0 %. Je dovolj blizu Googlovi Gemmi 2, vendar ne dovolj, da bi se približal OpenAI-ju GPT-4o mini ki ima 82 % na MMLU.

Slednji je videti takole:

OpenAI GPT-4o mini

Vsestranski, večjezični model beleži tudi močne zmogljivosti v različnih jezikih in je usposobljen za učinkovito klicanje funkcij. Uporablja napredni Tekken tokenizer, ki stisne besedilo in kodo učinkoviteje kot prejšnji modeli, zlasti v določenih jezikih.

Mistral je prišel nedolgo nazaj, komaj več kot leto dni od nekdanjih zaposlenih v Meti in Googlu DeepMind. Podjetje, ki je imelo krog financiranja v višini približno 645 milijonov dolarjev junija 2024, že povzroča valove v tekmi za AI.

V začetku tega leta tudi Microsoft in Mistral AI razglasitve partnerstvo, v katerem so Mistralovi napredni veliki jezikovni modeli (LLM) najprej na voljo na Microsoftovi platformi v oblaku Azure. Podjetje se je pridružilo tudi OpenAI pri ponudbi komercialnih modelov na Azure.

Uporabniški forum

Sporočila 0