微软仅使用 Nvidia 的 AI 友好型 H3 GPU 对 Phi-100 Mini 进行了一周的训练

Phi-3 的迷你版是目前唯一可用的型号

阅读时间图标 2分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

重点说明

  • 微软推出Phi-3型号,以Phi-3 Mini为首,参数为3.8B,
  • 该模型使用 3.3 个 NVIDIA H512 GPU 在 100 天内对 XNUMX 万亿个令牌进行了训练。
  • Phi-3 系列还包括小型和中型型号,其性能优于 Phi-2 等之前的型号。

微软推出了 Phi-3家族 的型号,目前市场上最好的小型型号之一。而现在,英伟达 说过 并描述了雷德蒙德公司如何使用其 H100 GPU 来训练这些模型,或者更具体地说,Mini 3.8B 版本。

该技术制造商周二表示:“该模型拥有 3.8 亿个参数,仅 3.3 天就在 512 个 NVIDIA H100 Tensor Core GPU 上接受了 XNUMX 万亿个代币的训练。” 

Phi-3 系列提供三种型号:Phi-3 Mini (3.8B)、Phi-3 Small (7B) 和 Phi-3 Medium (14B)。与之前相比,这是一个巨大的进步 Φ2 几个月前推出时只有 2.7B 参数。 

更具体地说,Phi-3 Mini 根据支持的令牌还提供两个选项:4K 和 128K。您可以在 Nvidia 的 AI 中心尝试后者作为面向开发人员的 Nvidia NIM 服务,并使用 Windows DirectML 或 TensorRT-LLM 在本地运行模型。

“在关键基准测试中,Phi-3 模型的性能明显优于相同和更大尺寸的语言模型(请参阅下面的基准数据,越高越好),”微软 说过 在推出型号时,吹嘘中小型版本可以胜过GPT-3.5T等大型型号。 

目前市场上有Mini版本,但微软承诺所有其他两种型号将很快上市。您还可以在 Azure AI 和 Hugging Face 上尝试 Phi-3 Mini。

发表评论

您的电邮地址不会被公开。 必填带 *