Os novos modelos de linguagem de código aberto DBRX da Databricks, no valor de US$ 10 milhões, finalmente chegaram

Para um modelo de código aberto que custou US$ 10 milhões e 2 meses para treinar, é impressionante.

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Notas chave

  • Databricks lança DBRX, seu conjunto de modelos generativos de IA no GitHub e Hugging Face.
  • O DBRX inclui o DBRX Base para tarefas baseadas em instruções e o DBRX Instruct para personalização.
  • Requer hardware poderoso para funcionar e supera outros modelos como o GPT-3.5.

Databricks anunciou recentemente que está lançando DBRX, seu conjunto de modelos generativos de IA que agora está disponível no GitHub e no Hugging Face. É pré-treinado em tokens 12T, usa GLU e GQA e não é multimodal (não pode executar imagens).

O modelo possui duas versões, o DBRX Base, otimizado para tarefas baseadas em instruções, e o DBRX Instruct, um modelo pré-treinado adequado para maior customização. O modelo de parâmetros 132B é de código aberto e está disponível em inglês, embora afirme ser capaz de ser traduzido também para francês, alemão e espanhol.

O vice-presidente de IA generativa da Databricks, Naveen Rao, divulgou em um TechCrunch entrevista que a empresa investiu US$ 10 milhões e dois meses no treinamento dos modelos. Mas o problema é que rodar esses modelos requer hardware robusto, como um mínimo de 4 GPUs Nvidia H100 ou equivalente, totalizando 320 GB de memória, ou uma nuvem de terceiros com requisitos mais ou menos semelhantes. 

De acordo com a sua comunicados à CMVM, DBRX afirma que pode superar os modelos de código aberto existentes, como LLaMA2-70B, GPT-3.5, Mixtral e Grok-1 em certas coisas como matemática, lógica e muito mais. Você pode colocá-los para funcionar diretamente com o Databricks Model Serving ou personalizá-los ainda mais para necessidades específicas, pois são licenciados para uso com a Licença de Modelo Aberto do Databricks. 

Eles podem ser implantados diretamente no Databricks Model Serving ou utilizados para fins de ajuste fino e inferência em lote.

Você pode experimentar os modelos de código aberto DBRX do Databricks SUA PARTICIPAÇÃO FAZ A DIFERENÇA.