Il modello OpenAI o1 ora alimenta ChatGPT, disponibile anche per gli utenti gratuiti

L'azienda prevede inoltre di portare l'o1-mini agli utenti gratuiti

Icona del tempo di lettura 2 minuto. leggere


I lettori aiutano a supportare MSpoweruser. Potremmo ricevere una commissione se acquisti tramite i nostri link. Icona descrizione comando

Leggi la nostra pagina informativa per scoprire come puoi aiutare MSPoweruser a sostenere il team editoriale Per saperne di più

Note chiave

  • OpenAI ha lanciato OpenAI o1, un modello di ragionamento alla base di ChatGPT.
  • L'o1 è più preciso, ma più lento e costoso rispetto ai modelli precedenti.
  • È disponibile per gli utenti Plus, Team e presto anche per gli utenti Edu ed Enterprise.
ChatGPT_OpenAI o1

OpenAI ha lanciato il suo primo modello in assoluto per le capacità di ragionamento, l'OpenAI o1, e sta per alimentare il famoso chatbot ChatGPT.

L'ultimo modello, insieme al più piccolo e più economico OpenAI o1-mini, è il primo di una nuova serie di modelli di "ragionamento" progettati per gestire attività complesse, come la codifica e la risoluzione di problemi in più fasi. Sebbene più accurato e capace dei modelli precedenti, o1 è più lento e costoso da usare e presenta ancora alcuni problemi con le allucinazioni.

"Sia o1-preview che o1-mini possono essere selezionati manualmente nel selettore modello e, al momento del lancio, i limiti di tariffa settimanali saranno di 30 messaggi per o1-preview e 50 per o1-mini. Stiamo lavorando per aumentare tali tariffe e consentire a ChatGPT di scegliere automaticamente il modello giusto per un dato prompt", afferma l'azienda sostenuta da Microsoft.

OpenAI o1 alimenterà ChatGPT. Gli utenti Paid Plus e Team possono già provare il modello, mentre gli utenti Enterprise ed Edu inizieranno la prossima settimana. L'azienda prevede anche di portare o1-mini agli utenti free, anche se la data esatta non è stata annunciata.

Rispetto al precedente Modello GPT-4o, o1, che ottiene un punteggio del 78.2% nel benchmark MMLU, supera quest'ultimo in 54 delle 57 sottocategorie del benchmark, nonostante un punteggio complessivo dell'82.0%.

Supera di gran lunga GPT-4o anche in ambiti quali la matematica, dove ha risolto il 74% dei problemi su AIME (rispetto al 4% di GPT-12o), e ha persino superato esperti con dottorato su GPQA Diamond, un punto di riferimento in chimica, fisica e biologia.

Forum degli utenti

0 messaggi