Databricks' nye DBRX åpen kildekode-språkmodeller verdt 10 millioner dollar er endelig her

For en åpen kildekode-modell som koster $10 millioner og 2 måneder å trene, er det imponerende.

Ikon for lesetid 2 min. lese


Lesere hjelper til med å støtte MSpoweruser. Vi kan få provisjon hvis du kjøper gjennom lenkene våre. Verktøytipsikon

Les vår avsløringsside for å finne ut hvordan du kan hjelpe MSPoweruser opprettholde redaksjonen Les mer

Viktige merknader

  • Databricks lanserer DBRX, sitt sett med generative AI-modeller på GitHub og Hugging Face.
  • DBRX inkluderer DBRX Base for instruksjonsbaserte oppgaver og DBRX Instruct for tilpasning.
  • Den krever kraftig maskinvare for å kjøre og overgår andre modeller som GPT-3.5.

Databricks har nylig annonsert at det er lanserer DBRX, dets sett med generative AI-modeller som nå er tilgjengelig på GitHub og Hugging Face. Den er forhåndstrent på 12T-tokens, bruker GLU og GQA, og er ikke multimodal (kan ikke kjøre bilder).

Modellen har to versjoner, DBRX Base, optimalisert for instruksjonsbaserte oppgaver, og DBRX Instruct, en forhåndsopplært modell egnet for ytterligere tilpasning. 132B-parametermodellen er åpen kildekode og tilgjengelig på engelsk, selv om den hevder å være i stand til å oversette til fransk, tysk og spansk også.

Databricks' VP for generativ AI, Naveen Rao, avslørt i en TechCrunch intervju om at selskapet investerte 10 millioner dollar og to måneder i opplæring av modellene. Men haken er at å kjøre disse modellene krever heftig maskinvare, som minimum 4 Nvidia H100 GPUer eller tilsvarende, totalt 320 GB minne, eller en tredjeparts sky med mer eller mindre lignende krav. 

Ifølge sin pressemelding, hevder DBRX at den kan utkonkurrere eksisterende åpen kildekode-modeller som LLaMA2-70B, GPT-3.5, Mixtral og Grok-1 på visse ting som matematikk, logikk og mer. Du kan sette dem i arbeid direkte med Databricks Model Serving eller tilpasse dem ytterligere for spesifikke behov ettersom de er lisensiert for bruk med Databricks Open Model License. 

De kan distribueres direkte til Databricks Model Serving eller brukes til finjustering og batch-slutningsformål.

Du kan prøve Databricks' DBRX open source-modeller her..