Snowflake 最新的北极文本嵌入模型优于竞争对手

阅读时间图标 2分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

重点说明

  • Snowflake 推出用于下一代企业搜索的开源 Arctic 嵌入模型。
雪花北极文本嵌入模型

Snowflake 今天宣布开源其 Arctic embed 系列人工智能模型。最大的雪花 北极嵌入模型 尽管体积小得多,但在大规模文本嵌入基准(MTEB)上的表现优于竞争对手。拥有 330 亿个参数的最大北极嵌入模型创下了 55.9 的检索性能记录。对于寻求功能强大且经济高效的搜索解决方案的企业来说,这标志着一个突破。

Arctic 嵌入模型现已在 Apache 2.0 许可证下在 Hugging Face 上提供,并且很快将在 Snowflake 的 Cortex 嵌入功能中提供(目前处于私人预览版)。

主要亮点:

  • 一流的检索: 该套件由五个 Arctic 嵌入模型组成,可提供各种尺寸的最先进的搜索结果,在 MTEB 检索基准上优于其他开源模型。
  • 性能和效率: Snowflake 的大型 (l) 模型以 4 倍的参数击败闭源模型,以更小的占地面积提供卓越的性能。
  • 长文档支持: 中 (m) 模型包括用于无缝处理扩展文档(最多 8192 个标记)的长上下文版本。
  • 针对企业优化: 与同等质量的替代方案相比,Arctic 嵌入式模型在延迟较低和总拥有成本 (TCO) 方面表现出色。

寻找更好的搜索

Snowflake 的人工智能业务因收购 Neeva 而得到加强。这些模型利用 Snowflake 成熟的搜索专业知识和前沿研究,为希望通过专有数据和法学硕士改进搜索能力的企业提供无与伦比的解决方案。

开源、企业级

Snowflake 的 Arctic 嵌入模型有望颠覆市场,挑战闭源嵌入 API 的主导地位。它们为 OpenAI 和 Cohere 等提供商提供了强大的开源替代方案,无需供应商锁定即可进行部署。

有关主题的更多信息: 北极, 雪花

发表评论

您的电邮地址不会被公开。 必填带 *