I nuovi modelli linguistici open source DBRX del valore di 10 milioni di dollari di Databricks sono finalmente arrivati

Per un modello open source che è costato 10 milioni di dollari e 2 mesi per la formazione, è impressionante.

Icona del tempo di lettura 2 minuto. leggere


I lettori aiutano a supportare MSpoweruser. Potremmo ricevere una commissione se acquisti tramite i nostri link. Icona descrizione comando

Leggi la nostra pagina informativa per scoprire come puoi aiutare MSPoweruser a sostenere il team editoriale Per saperne di più

Note chiave

  • Databricks lancia DBRX, il suo set di modelli di intelligenza artificiale generativa su GitHub e Hugging Face.
  • DBRX include DBRX Base per attività basate su istruzioni e DBRX Instruct per la personalizzazione.
  • Richiede un hardware potente per funzionare e surclassa altri modelli come GPT-3.5.

Databricks lo ha appena annunciato di recente lancio di DBRX, il suo set di modelli di intelligenza artificiale generativa ora disponibile su GitHub e Hugging Face. È pre-addestrato su token 12T, utilizza GLU e GQA e non è multimodale (non può eseguire immagini).

Il modello ha due versioni, DBRX Base, ottimizzata per attività basate su istruzioni, e DBRX Instruct, un modello pre-addestrato adatto per ulteriore personalizzazione. Il modello dei parametri 132B è open source e disponibile in inglese, sebbene affermi di essere in grado di essere tradotto anche in francese, tedesco e spagnolo.

Il vicepresidente dell'intelligenza artificiale generativa di Databricks, Naveen Rao, ha rivelato in a TechCrunch intervista che l'azienda ha investito 10 milioni di dollari e due mesi nella formazione dei modelli. Ma il problema è che l'esecuzione di questi modelli richiede hardware pesante, come un minimo di 4 GPU Nvidia H100 o equivalenti, per un totale di 320 GB di memoria, o un cloud di terze parti con requisiti più o meno simili. 

Secondo il suo comunicato stampa, DBRX afferma di poter sovraperformare i modelli open source esistenti come LLaMA2-70B, GPT-3.5, Mixtral e Grok-1 su certe cose come la matematica, la logica e altro ancora. Puoi metterli in funzione direttamente con Databricks Model Serving o personalizzarli ulteriormente per esigenze specifiche poiché sono concessi in licenza per l'uso con Databricks Open Model License. 

Possono essere distribuiti direttamente in Databricks Model Serving o utilizzati per scopi di perfezionamento e inferenza batch.

Puoi provare i modelli open source DBRX di Databricks qui.

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *