Databricks nya DBRX-språkmodeller med öppen källkod för 10 miljoner dollar är äntligen här

För en modell med öppen källkod som kostade 10 miljoner USD och 2 månader att träna, är det imponerande.

Lästid ikon 2 min. läsa


Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar. Verktygstipsikon

Läs vår informationssida för att ta reda på hur du kan hjälpa MSPoweruser upprätthålla redaktionen Läs mer

Viktiga anteckningar

  • Databricks lanserar DBRX, dess uppsättning generativa AI-modeller på GitHub och Hugging Face.
  • DBRX inkluderar DBRX Base för instruktionsbaserade uppgifter och DBRX Instruct för anpassning.
  • Den kräver kraftfull hårdvara för att köras och överträffar andra modeller som GPT-3.5.

Databricks har nyligen meddelat att det är lanserar DBRX, dess uppsättning generativa AI-modeller som nu är tillgängliga på GitHub och Hugging Face. Den är förtränad på 12T-tokens, använder GLU och GQA och är inte multimodal (kan inte köra bilder).

Modellen har två versioner, DBRX Base, optimerad för instruktionsbaserade uppgifter, och DBRX Instruct, en förtränad modell som lämpar sig för ytterligare anpassning. 132B-parametrarmodellen är öppen källkod och tillgänglig på engelska, även om den påstår sig kunna översätta till franska, tyska och spanska också.

Databricks VP för generativ AI, Naveen Rao, avslöjade i en TechCrunch intervju att företaget investerat 10 miljoner dollar och två månader på att träna modellerna. Men haken är att att köra dessa modeller kräver rejäl hårdvara, som minst 4 Nvidia H100 GPU eller motsvarande, totalt 320 GB minne, eller ett tredjepartsmoln med mer eller mindre liknande krav. 

Enligt dess pressmeddelande, hävdar DBRX att det kan överträffa befintliga modeller med öppen källkod som LLaMA2-70B, GPT-3.5, Mixtral och Grok-1 på vissa saker som matematik, logik och mer. Du kan sätta dem i arbete direkt med Databricks Model Serving eller anpassa dem ytterligare för specifika behov eftersom de är licensierade för användning med Databricks Open Model License. 

De kan distribueras direkt till Databricks Model Serving eller användas för finjustering och slutledningssyfte.

Du kan prova Databricks DBRX-modeller med öppen källkod här..