De nieuwe DBRX open-source taalmodellen ter waarde van $10 miljoen van Databricks zijn eindelijk hier

Voor een open-sourcemodel dat 10 miljoen dollar en twee maanden training kostte, is het indrukwekkend.

Pictogram voor leestijd 2 minuut. lezen


Lezers helpen MSpoweruser ondersteunen. We kunnen een commissie krijgen als u via onze links koopt. Tooltip-pictogram

Lees onze openbaarmakingspagina om erachter te komen hoe u MSPoweruser kunt helpen het redactieteam te ondersteunen Lees meer

Belangrijkste opmerkingen

  • Databricks lanceert DBRX, de set generatieve AI-modellen op GitHub en Hugging Face.
  • DBRX omvat DBRX Base voor op instructies gebaseerde taken en DBRX Instruct voor maatwerk.
  • Het vereist krachtige hardware om te kunnen werken en presteert beter dan andere modellen zoals GPT-3.5.

Databricks heeft onlangs aangekondigd dat dit het geval is DBRX lanceren, de set generatieve AI-modellen die nu beschikbaar is op GitHub en Hugging Face. Het is vooraf getraind op 12T-tokens, gebruikt GLU en GQA en is niet multimodaal (kan geen afbeeldingen uitvoeren).

Het model heeft twee versies: de DBRX Base, geoptimaliseerd voor instructiegebaseerde taken, en de DBRX Instruct, een vooraf getraind model dat geschikt is voor verdere aanpassingen. Het 132B-parametermodel is open source en beschikbaar in het Engels, hoewel het claimt ook in het Frans, Duits en Spaans te kunnen vertalen.

Databricks' vice-president van generatieve AI, Naveen Rao, onthuld in een TechCrunch interview dat het bedrijf $ 10 miljoen en twee maanden investeerde in het trainen van de modellen. Maar het addertje onder het gras is dat het draaien van deze modellen flinke hardware vereist, zoals minimaal 4 Nvidia H100 GPU's of gelijkwaardig, met in totaal 320 GB geheugen, of een cloud van derden met min of meer vergelijkbare vereisten. 

Volgens zijn persberichtbeweert DBRX dat het beter kan presteren dan bestaande open-sourcemodellen zoals LLaMA2-70B, GPT-3.5, Mixtral en Grok-1 over bepaalde dingen zoals wiskunde, logica en meer. U kunt ze rechtstreeks aan het werk zetten met Databricks Model Serving of ze verder aanpassen aan specifieke behoeften, aangezien ze een licentie hebben voor gebruik met de Databricks Open Model License. 

Ze kunnen rechtstreeks worden geïmplementeerd in Databricks Model Serving of worden gebruikt voor verfijning en batch-inferentiedoeleinden.

U kunt de DBRX open source-modellen van Databricks proberen hier.