Il piccolo modello NeMo di Mistral sfida l'ultimo mini GPT-4o di OpenAI

OpenAI ha lanciato il GPT-4o mini non molto tempo fa

Casa » Notizie

2 minuto. leggere

Edizione del Luglio 19, 2024

by Rafly Gilang

pubblicato su Luglio 19, 2024

Condividi questo articolo

Migliora questa guida

I lettori aiutano a supportare MSpoweruser. Potremmo ricevere una commissione se acquisti tramite i nostri link.

Note chiave

Mistral AI ha rilasciato NeMo, un modello 12B con il supporto di Nvidia, rivaleggiando con GPT-4o mini di OpenAI.
NeMo supporta 128 token e ottiene un punteggio del 68.0% su MMLU, inferiore all'4% di GPT-82o mini.
Mistral, finanziata con 645 milioni di dollari, ha collaborato con Microsoft per offrire modelli su Azure.

Mistral AI ha appena annunciato il suo ultimo modello più piccolo, nemo, con il forte sostegno di Nvidia. È interessante notare che l'annuncio è arrivato quando OpenAI ha annunciato il suo modello leggero ed economico, il GPT-4omini, che ottiene punteggi di riferimento migliori rispetto a Gemini Flash e Claude Haiku.

Questo modello 12B "all'avanguardia" supporta una lunghezza di contesto fino a 128 token, è progettato per prestazioni elevate in termini di ragionamento, conoscenza del mondo e precisione di codifica ed è attualmente disponibile con la licenza Apache 2.0. Entrambi base che a ottimizzato per le istruzioni è possibile accedere alle versioni su HuggingFace e altre piattaforme.

Anche il NeMo di Mistral registra alcune prestazioni di riferimento impressionanti. Il benchmark MMLU, che misura la conoscenza complessiva di un modello e le capacità di risoluzione dei problemi, vede NeMo ottenere un punteggio del 68.0%. È abbastanza vicino al Gemma 2 di Google, ma non abbastanza per avvicinarsi a quello di OpenAI GPT-4omini che ha un 82% su MMLU.

Ecco come appare quest'ultimo:

Il modello versatile e multilingue registra anche forti capacità in varie lingue ed è addestrato per un'efficiente chiamata di funzioni. Utilizza l'avanzato tokenizzatore Tekken, che comprime testo e codice in modo più efficace rispetto ai modelli precedenti, in particolare in lingue specifiche.

Mistral è arrivato non molto tempo fa, poco più di un anno fa da ex dipendenti di Meta e Google DeepMind. La società, che ha ricevuto un round di finanziamento di circa 645 milioni di dollari nel giugno 2024, ha già fatto scalpore nella corsa all’intelligenza artificiale.

All'inizio di quest'anno, anche Microsoft e Mistral AI ha annunciato una partnership che vede i modelli avanzati di grandi linguaggi (LLM) di Mistral disponibili per primi sulla piattaforma cloud Azure di Microsoft. L'azienda si è inoltre unita a OpenAI nell'offrire modelli commerciali su Azure.

Rafly Gilang

Giornalista tecnico

Rafly è un reporter con anni di esperienza giornalistica, che spazia dalla tecnologia, al business, al sociale e alla cultura. Attualmente riporta notizie su prodotti correlati a Microsoft, tecnologia e IA su MSPowerUser. Hai un suggerimento? Invialo a [email protected]

Forum degli utenti

0 messaggi

Ordina per:

Lascia un Commento cancella risposta