微软宣布推出 Phi-3-vision,这是一种用于设备上 AI 场景的新型多模式 SLM

阅读时间图标 1分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

重点说明

  • Phi-3-vision是一个4.2B参数模型,支持一般视觉推理任务和图表/图形/表格推理

在 Build 2024 大会上,微软今天 扩大 其 Phi-3 系列 AI 小语言模型具有新的 Phi-3-vision。 Phi-3-vision 是一个 4.2B 参数模型,支持一般视觉推理任务和图表/图形/表格推理。该模型可以将图像和文本作为输入,并输出文本响应。

微软今天还宣布 Phi-3-mini 在 Azure AI 的模型即服务 (MaaS) 产品中全面上市。 Phi-3 型号 由于它们具有成本效益并且针对设备上、边缘、离线推理和延迟受限的 AI 场景进行了优化,因此正在获得发展势头。

除了有关 Phi-3 模型的消息外,微软还宣布了跨 API 的新功能,以实现多模式体验。 Azure AI Speech 现在具有语音分析和通用翻译功能。 Azure AI 搜索现在显着增加了存储空间,矢量索引大小增加了 12 倍,无需额外成本即可大规模支持大型 RAG 工作负载。

用户论坛

0消息