Os novos modelos de linguagem de código aberto DBRX da Databricks, no valor de US$ 10 milhões, finalmente chegaram
Para um modelo de código aberto que custou US$ 10 milhões e 2 meses para treinar, é impressionante.
2 minutos. ler
Publicado em
Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais
Notas chave
- Databricks lança DBRX, seu conjunto de modelos generativos de IA no GitHub e Hugging Face.
- O DBRX inclui o DBRX Base para tarefas baseadas em instruções e o DBRX Instruct para personalização.
- Requer hardware poderoso para funcionar e supera outros modelos como o GPT-3.5.
Databricks anunciou recentemente que está lançando DBRX, seu conjunto de modelos generativos de IA que agora está disponível no GitHub e no Hugging Face. É pré-treinado em tokens 12T, usa GLU e GQA e não é multimodal (não pode executar imagens).
O modelo possui duas versões, o DBRX Base, otimizado para tarefas baseadas em instruções, e o DBRX Instruct, um modelo pré-treinado adequado para maior customização. O modelo de parâmetros 132B é de código aberto e está disponível em inglês, embora afirme ser capaz de ser traduzido também para francês, alemão e espanhol.
O vice-presidente de IA generativa da Databricks, Naveen Rao, divulgou em um TechCrunch entrevista que a empresa investiu US$ 10 milhões e dois meses no treinamento dos modelos. Mas o problema é que rodar esses modelos requer hardware robusto, como um mínimo de 4 GPUs Nvidia H100 ou equivalente, totalizando 320 GB de memória, ou uma nuvem de terceiros com requisitos mais ou menos semelhantes.
De acordo com a sua comunicados à CMVM, DBRX afirma que pode superar os modelos de código aberto existentes, como LLaMA2-70B, GPT-3.5, Mixtral e Grok-1 em certas coisas como matemática, lógica e muito mais. Você pode colocá-los para funcionar diretamente com o Databricks Model Serving ou personalizá-los ainda mais para necessidades específicas, pois são licenciados para uso com a Licença de Modelo Aberto do Databricks.
Eles podem ser implantados diretamente no Databricks Model Serving ou utilizados para fins de ajuste fino e inferência em lote.
Você pode experimentar os modelos de código aberto DBRX do Databricks SUA PARTICIPAÇÃO FAZ A DIFERENÇA.