Databricks' nye DBRX open source sprogmodeller til en værdi af $10 millioner er endelig her

For en open source-model, der koster $10 millioner og 2 måneder at træne, er det imponerende.

Ikon for læsetid 2 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

Nøgle noter

  • Databricks lancerer DBRX, dets sæt af generative AI-modeller på GitHub og Hugging Face.
  • DBRX inkluderer DBRX Base til instruktionsbaserede opgaver og DBRX Instruct til tilpasning.
  • Det kræver kraftig hardware at køre og overgår andre modeller som GPT-3.5.

Databricks har for nylig annonceret, at det er lancerer DBRX, dets sæt generative AI-modeller, der nu er tilgængelige på GitHub og Hugging Face. Den er fortrænet på 12T-tokens, bruger GLU og GQA og er ikke multimodal (kan ikke køre billeder).

Modellen har to versioner, DBRX Base, optimeret til instruktionsbaserede opgaver, og DBRX Instruct, en præ-trænet model, der er egnet til yderligere tilpasning. 132B-parametremodellen er open source og tilgængelig på engelsk, selvom den hævder at være i stand til også at oversætte til fransk, tysk og spansk.

Databricks' VP for generativ AI, Naveen Rao, afsløret i en TechCrunch interview om, at virksomheden investerede 10 millioner dollars og to måneder i at træne modellerne. Men fangsten er, at kørsel af disse modeller kræver heftig hardware, som minimum 4 Nvidia H100 GPU'er eller tilsvarende, i alt 320 GB hukommelse, eller en tredjepartssky med mere eller mindre lignende krav. 

Ifølge dens pressemeddelelse, hævder DBRX, at den kan udkonkurrere eksisterende open source-modeller som LLaMA2-70B, GPT-3.5, Mixtral og Grok-1 på visse ting som matematik, logik og meget mere. Du kan sætte dem til at arbejde direkte med Databricks Model Serving eller tilpasse dem yderligere til specifikke behov, da de er licenseret til brug med Databricks Open Model License. 

De kan implementeres direkte til Databricks Model Serving eller bruges til finjustering og batchslutningsformål.

Du kan prøve Databricks' DBRX open source-modeller link..