Apple 的 OpenELM 开源模型与 Microsoft 的 Phi-3 在参数方面有何不同？

巧合？

阅读时间图标 2分钟读

日历图标发表于 2024 年 4 月 24 日

发表于 2024 年 4 月 24 日

读者帮助支持 MSpoweruser。如果您通过我们的链接购买，我们可能会获得佣金。

重点说明

微软推出后不久 Phi-3家族一套专为轻便使用而设计的小型开源模型，苹果也加入了这列火车。 iPhone 制造商（悄悄地）推出了 OpenELM，这是其最新的开源人工智能模型。

OpenELM 是开源高效语言模型的缩写，有八种变体，每种变体预训练和指令调整得到四个。苹果公司的研究人员说过该模型使用逐层缩放策略来有效地在变压器模型的每一层内分配参数，并且您可以在拥抱脸.

“例如，在参数预算约为 2.36 亿个参数的情况下，OpenELM 与 OLMo 相比，准确率提高了 2%，同时需要的预训练令牌减少了 XNUMX 倍，”文档中写道。

至于尺寸，每个型号都有不同的参数：270亿、450亿、1.1亿、3亿。虽然它并不总是最好的测量标准，但人工智能模型中的参数始终是比较它们的起点。

坦率地说，OpenELM 并不像其他开源模型那样令人印象深刻（参数方面）：骆驼3为 Meta AI 提供支持，参数数量上限为 70 亿，微软支持的 Mixtral 推出了其 8x22B型号具有 176B 参数。

Phi-3-mini 是微软 Phi-3 模型的最小版本，拥有 3.8 亿个参数，训练了一周使用 Nvidia 的 H100 GPU。相比之下，中型版本有 14 亿个参数，小型版本有 7 亿个参数。

拉夫利·吉朗

科技记者

Rafly 是一位拥有多年新闻经验的记者，涉猎领域涵盖技术、商业、社会和文化。目前在 Windows Report 和 MSPowerUser 上报告 Microsoft 相关产品、技术和 AI 的新闻。有小费吗？发送至 [电子邮件保护].