Nové modely open source jazykov DBRX od Databricks v hodnote 10 miliónov dolárov sú konečne tu

Pre model s otvoreným zdrojovým kódom, ktorý stojí 10 miliónov dolárov a 2 mesiace školenia, je to pôsobivé.

Ikona času čítania 2 min. čítať


Čítačky pomáhajú podporovať MSpoweruser. Ak nakupujete prostredníctvom našich odkazov, môžeme získať províziu. Ikona popisu

Prečítajte si našu informačnú stránku a zistite, ako môžete pomôcť MSPoweruser udržať redakčný tím Čítaj viac

Kľúčové poznámky

  • Databricks spúšťa DBRX, svoju sadu generatívnych modelov AI na GitHub a Hugging Face.
  • DBRX obsahuje DBRX Base pre úlohy založené na pokynoch a DBRX Instruct na prispôsobenie.
  • Na spustenie vyžaduje výkonný hardvér a prekonáva iné modely, ako je GPT-3.5.

Databricks len nedávno oznámil, že áno spustenie DBRX, jeho súbor generatívnych modelov AI, ktorý je teraz dostupný na GitHub a Hugging Face. Je predtrénovaný na 12T tokenoch, používa GLU a GQA a nie je multimodálny (nemôže spúšťať obrázky).

Model má dve verzie, DBRX Base, optimalizovanú pre úlohy založené na pokynoch, a DBRX Instruct, predtrénovaný model vhodný na ďalšie prispôsobenie. Model parametrov 132B je open source a je dostupný v angličtine, hoci tvrdí, že je schopný preložiť ho aj do francúzštiny, nemčiny a španielčiny.

VP spoločnosti Databricks pre generatívnu AI, Naveen Rao, zverejnený v a TechCrunch rozhovor, že spoločnosť investovala 10 miliónov dolárov a dva mesiace do školenia modelov. Háčik je však v tom, že prevádzka týchto modelov vyžaduje poriadny hardvér, ako sú minimálne 4 GPU Nvidia H100 alebo ekvivalent, s celkovou kapacitou 320 GB pamäte, alebo cloud tretej strany s viac-menej podobnými požiadavkami. 

Podľa jeho tlačová správa, DBRX tvrdí, že môže prekonať existujúce modely s otvoreným zdrojom, ako sú LLaMA2-70B, GPT-3.5, Mixtral a Grok-1 na určité veci, ako je matematika, logika a ďalšie. Môžete ich uviesť do práce priamo so službou Databricks Model Serving alebo ich ďalej prispôsobiť špecifickým potrebám, pretože sú licencované na používanie s licenciou Databricks Open Model License. 

Môžu byť nasadené priamo do Databricks Model Serving alebo použité na dolaďovanie a dávkové odvodenie.

Môžete vyskúšať open-source modely DBRX od Databricks tu.