Nové modely open source jazykov DBRX od Databricks v hodnote 10 miliónov dolárov sú konečne tu
Pre model s otvoreným zdrojovým kódom, ktorý stojí 10 miliónov dolárov a 2 mesiace školenia, je to pôsobivé.
2 min. čítať
Publikované dňa
Prečítajte si našu informačnú stránku a zistite, ako môžete pomôcť MSPoweruser udržať redakčný tím Čítaj viac
Kľúčové poznámky
- Databricks spúšťa DBRX, svoju sadu generatívnych modelov AI na GitHub a Hugging Face.
- DBRX obsahuje DBRX Base pre úlohy založené na pokynoch a DBRX Instruct na prispôsobenie.
- Na spustenie vyžaduje výkonný hardvér a prekonáva iné modely, ako je GPT-3.5.
Databricks len nedávno oznámil, že áno spustenie DBRX, jeho súbor generatívnych modelov AI, ktorý je teraz dostupný na GitHub a Hugging Face. Je predtrénovaný na 12T tokenoch, používa GLU a GQA a nie je multimodálny (nemôže spúšťať obrázky).
Model má dve verzie, DBRX Base, optimalizovanú pre úlohy založené na pokynoch, a DBRX Instruct, predtrénovaný model vhodný na ďalšie prispôsobenie. Model parametrov 132B je open source a je dostupný v angličtine, hoci tvrdí, že je schopný preložiť ho aj do francúzštiny, nemčiny a španielčiny.
VP spoločnosti Databricks pre generatívnu AI, Naveen Rao, zverejnený v a TechCrunch rozhovor, že spoločnosť investovala 10 miliónov dolárov a dva mesiace do školenia modelov. Háčik je však v tom, že prevádzka týchto modelov vyžaduje poriadny hardvér, ako sú minimálne 4 GPU Nvidia H100 alebo ekvivalent, s celkovou kapacitou 320 GB pamäte, alebo cloud tretej strany s viac-menej podobnými požiadavkami.
Podľa jeho tlačová správa, DBRX tvrdí, že môže prekonať existujúce modely s otvoreným zdrojom, ako sú LLaMA2-70B, GPT-3.5, Mixtral a Grok-1 na určité veci, ako je matematika, logika a ďalšie. Môžete ich uviesť do práce priamo so službou Databricks Model Serving alebo ich ďalej prispôsobiť špecifickým potrebám, pretože sú licencované na používanie s licenciou Databricks Open Model License.
Môžu byť nasadené priamo do Databricks Model Serving alebo použité na dolaďovanie a dávkové odvodenie.
Môžete vyskúšať open-source modely DBRX od Databricks tu.