Microsoft는 Nvidia의 AI 친화적인 H3 GPU를 사용하여 Phi-100 Mini를 일주일 동안만 훈련시켰습니다.

Phi-3의 Mini 버전은 현재 사용 가능한 유일한 모델입니다.

홈 » 뉴스

독서 시간 아이콘 2 분. 읽다

달력 아이콘 에 게시됨 2024 년 4 월 24 일

by 라플라이 길랑

에 게시 2024 년 4 월 24 일

독자들은 MSpoweruser를 지원하는 데 도움을 줍니다. 당사의 링크를 통해 구매하시면 수수료를 받을 수 있습니다.

주요 사항

Microsoft는 3B 매개변수를 갖춘 Phi-3 Mini가 주도하는 Phi-3.8 모델을 출시했습니다.
이 모델은 3.3개의 NVIDIA H512 GPU를 사용하여 100일 만에 XNUMX조 XNUMX천억 개의 토큰에 대해 훈련되었습니다.
Phi-3 제품군에는 Phi-2와 같은 이전 모델보다 성능이 뛰어난 소형 및 중형 변형도 포함되어 있습니다.

Microsoft는 Phi-3 계열 현재 시장에서 가장 작은 모델 중 하나입니다. 그리고 지금, 엔비디아 말했다 Redmond 회사가 H100 GPU를 사용하여 이러한 모델, 더 구체적으로 Mini, 3.8B 버전을 교육하는 방법을 설명했습니다.

"이 모델에는 3.8억 개의 매개변수가 있으며 3.3개의 NVIDIA H512 Tensor Core GPU에서 단 100일 만에 XNUMX조 XNUMX천억 개의 토큰에 대해 훈련되었습니다."라고 기술 제조업체가 화요일에 밝혔습니다.

Phi-3 제품군에는 Phi-3 Mini(3.8B), Phi-3 Small(7B), Phi-3 Medium(14B)의 세 가지 변형이 있습니다. 전작에 비해 엄청난 발전이군요 파이-2 몇 달 전에 단 2.7억 개의 매개변수로 출시되었습니다.

보다 구체적으로 Phi-3 Mini에는 지원 토큰에 따라 4K와 128K의 두 가지 옵션도 함께 제공됩니다. 후자를 Nvidia AI 센터에서 개발자를 위한 Nvidia NIM 서비스로 사용해 보고 Windows DirectML 또는 TensorRT-LLM을 사용하여 로컬에서 모델을 실행할 수 있습니다.

"Phi-3 모델은 주요 벤치마크에서 동일하거나 더 큰 크기의 언어 모델보다 훨씬 뛰어난 성능을 발휘합니다(아래 벤치마크 수치 참조, 높을수록 좋음)." Microsoft 말했다 모델을 출시할 때 Small 및 Medium 버전이 GPT-3.5T와 같은 대형 모델을 능가할 수 있다고 자랑합니다.

Mini 버전은 현재 시장에 나와 있지만 Microsoft는 다른 두 모델도 곧 출시될 것이라고 약속했습니다. Azure AI 및 Hugging Face에서 Phi-3 Mini를 사용해 볼 수도 있습니다.

라플라이 길랑

기술 기자

Rafly는 기술, 비즈니스, 사회, 문화 등 다양한 분야에서 수년간 저널리즘 경험을 쌓은 기자입니다. 현재 Windows Report 및 MSPowerUser에서 Microsoft 관련 제품, 기술 및 AI에 대한 뉴스를 보고하고 있습니다. 팁이 있나요? 다음으로 보내세요 [이메일 보호].