微软宣布推出 Phi-3-vision，这是一种用于设备上 AI 场景的新型多模式 SLM

首页 » 新闻中心

1分钟读

更新 2024 年 5 月 23 日

更新于 2024 年 5 月 23 日

分享此文章

改进本指南

读者帮助支持 MSpoweruser。如果您通过我们的链接购买，我们可能会获得佣金。

重点说明

在 Build 2024 大会上，微软今天扩大其 Phi-3 系列 AI 小语言模型具有新的 Phi-3-vision。 Phi-3-vision 是一个 4.2B 参数模型，支持一般视觉推理任务和图表/图形/表格推理。该模型可以将图像和文本作为输入，并输出文本响应。

微软今天还宣布 Phi-3-mini 在 Azure AI 的模型即服务 (MaaS) 产品中全面上市。 Phi-3 型号由于它们具有成本效益并且针对设备上、边缘、离线推理和延迟受限的 AI 场景进行了优化，因此正在获得发展势头。

除了有关 Phi-3 模型的消息外，微软还宣布了跨 API 的新功能，以实现多模式体验。 Azure AI Speech 现在具有语音分析和通用翻译功能。 Azure AI 搜索现在显着增加了存储空间，矢量索引大小增加了 12 倍，无需额外成本即可大规模支持大型 RAG 工作负载。

普拉迪普·维斯瓦夫

软件和服务专家

Pradeep 是计算机科学与工程专业的毕业生。他还是微软的学生合作伙伴。他目前在一家领先的 IT 公司工作。

用户论坛

0消息

排序：