Il piccolo modello NeMo di Mistral sfida l'ultimo mini GPT-4o di OpenAI

OpenAI ha lanciato il GPT-4o mini non molto tempo fa

Icona del tempo di lettura 2 minuto. leggere


I lettori aiutano a supportare MSpoweruser. Potremmo ricevere una commissione se acquisti tramite i nostri link. Icona descrizione comando

Leggi la nostra pagina informativa per scoprire come puoi aiutare MSPoweruser a sostenere il team editoriale Per saperne di più

Note chiave

  • Mistral AI ha rilasciato NeMo, un modello 12B con il supporto di Nvidia, rivaleggiando con GPT-4o mini di OpenAI.
  • NeMo supporta 128 token e ottiene un punteggio del 68.0% su MMLU, inferiore all'4% di GPT-82o mini.
  • Mistral, finanziata con 645 milioni di dollari, ha collaborato con Microsoft per offrire modelli su Azure.
Maestrale NeMo

Mistral AI ha appena annunciato il suo ultimo modello più piccolo, nemo, con il forte sostegno di Nvidia. È interessante notare che l'annuncio è arrivato quando OpenAI ha annunciato il suo modello leggero ed economico, il GPT-4omini, che ottiene punteggi di riferimento migliori rispetto a Gemini Flash e Claude Haiku.

Questo modello 12B "all'avanguardia" supporta una lunghezza di contesto fino a 128 token, è progettato per prestazioni elevate in termini di ragionamento, conoscenza del mondo e precisione di codifica ed è attualmente disponibile con la licenza Apache 2.0. Entrambi base che a ottimizzato per le istruzioni è possibile accedere alle versioni su HuggingFace e altre piattaforme.

Anche il NeMo di Mistral registra alcune prestazioni di riferimento impressionanti. Il benchmark MMLU, che misura la conoscenza complessiva di un modello e le capacità di risoluzione dei problemi, vede NeMo ottenere un punteggio del 68.0%. È abbastanza vicino al Gemma 2 di Google, ma non abbastanza per avvicinarsi a quello di OpenAI GPT-4omini che ha un 82% su MMLU.

Ecco come appare quest'ultimo:

GPT-4o mini di OpenAI

Il modello versatile e multilingue registra anche forti capacità in varie lingue ed è addestrato per un'efficiente chiamata di funzioni. Utilizza l'avanzato tokenizzatore Tekken, che comprime testo e codice in modo più efficace rispetto ai modelli precedenti, in particolare in lingue specifiche.

Mistral è arrivato non molto tempo fa, poco più di un anno fa da ex dipendenti di Meta e Google DeepMind. La società, che ha ricevuto un round di finanziamento di circa 645 milioni di dollari nel giugno 2024, ha già fatto scalpore nella corsa all’intelligenza artificiale.

All'inizio di quest'anno, anche Microsoft e Mistral AI ha annunciato una partnership che vede i modelli avanzati di grandi linguaggi (LLM) di Mistral disponibili per primi sulla piattaforma cloud Azure di Microsoft. L'azienda si è inoltre unita a OpenAI nell'offrire modelli commerciali su Azure.

Forum degli utenti

0 messaggi