Databricks의 천만 달러 상당의 새로운 DBRX 오픈 소스 언어 모델이 마침내 출시되었습니다.

10만 달러의 비용과 2개월의 훈련 비용이 드는 오픈 소스 모델의 경우 이는 인상적입니다.

독서 시간 아이콘 2 분. 읽다


독자들은 MSpoweruser를 지원하는 데 도움을 줍니다. 당사의 링크를 통해 구매하시면 수수료를 받을 수 있습니다. 툴팁 아이콘

공개 페이지를 읽고 MSPoweruser가 편집팀을 유지하는 데 어떻게 도움을 줄 수 있는지 알아보세요. 자세히 보기

주요 사항

  • Databricks는 GitHub 및 Hugging Face에서 생성 AI 모델 세트인 DBRX를 출시합니다.
  • DBRX에는 지침 기반 작업을 위한 DBRX Base와 사용자 정의를 위한 DBRX Instruct가 포함되어 있습니다.
  • GPT-3.5와 같은 다른 모델을 실행하고 성능을 능가하려면 강력한 하드웨어가 필요합니다.

Databricks는 최근에 다음과 같이 발표했습니다. DBRX 출시, 현재 GitHub 및 Hugging Face에서 사용할 수 있는 생성 AI 모델 세트입니다. 12T 토큰에 대해 사전 학습되었으며 GLU 및 GQA를 사용하고 다중 모드가 아닙니다(이미지를 실행할 수 없음).

이 모델에는 명령 기반 작업에 최적화된 DBRX Base와 추가 사용자 정의에 적합한 사전 훈련된 모델인 DBRX Instruct의 두 가지 버전이 있습니다. 132B 매개변수 모델은 오픈 소스이며 영어로 제공되지만 프랑스어, 독일어, 스페인어로도 번역할 수 있다고 주장합니다.

Databricks의 생성 AI 부사장 Naveen Rao는 테크 크런치 회사는 모델 훈련에 10만 달러와 4개월을 투자했다고 인터뷰했습니다. 그러나 문제는 이러한 모델을 실행하려면 최소 100개의 Nvidia H320 GPU 또는 동급, 총 XNUMXGB의 메모리 또는 다소 유사한 요구 사항을 가진 타사 클라우드와 같은 무거운 하드웨어가 필요하다는 것입니다. 

그것의 릴리스를 누르십시오, DBRX는 LLaMA2-70B, GPT-3.5, Mixtral 및 같은 기존 오픈 소스 모델보다 성능이 뛰어날 수 있다고 주장합니다. 그록-1 수학, 논리 등과 같은 특정 분야에 대해. Databricks Model Serving과 함께 직접 작업하도록 배치하거나 Databricks Open Model 라이선스와 함께 사용하도록 라이선스가 부여되었으므로 특정 요구 사항에 맞게 추가로 사용자 지정할 수 있습니다. 

Databricks Model Serving에 직접 배포하거나 미세 조정 및 일괄 추론 목적으로 활용할 수 있습니다.

Databricks의 DBRX 오픈 소스 모델을 사용해 볼 수 있습니다. 여기에서 지금 확인해 보세요..