微軟宣布推出 Phi-3-vision，這是一個用於裝置上 AI 場景的新型多模式 SLM

首頁 » 最新消息

1分鐘讀

更新了 2024 年 5 月 23 日

更新 2024 年 5 月 23 日

分享此文章

改進本指南

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

重點說明

在 Build 2024 大會上，微軟今天擴大其 Phi-3 系列 AI 小語言模型具有新的 Phi-3-vision。 Phi-3-vision 是一個 4.2B 參數模型，支援一般視覺推理任務和圖表/圖形/表格推理。該模型可以將圖像和文字作為輸入，並輸出文字回應。

微軟今天也宣布 Phi-3-mini 在 Azure AI 的模型即服務 (MaaS) 產品中全面上市。 Phi-3 型號由於它們具有成本效益並且針對設備上、邊緣、離線推理和延遲受限的 AI 場景進行了優化，因此正在獲得發展勢頭。

除了有關 Phi-3 模型的消息外，微軟還宣布了跨 API 的新功能，以實現多模式體驗。 Azure AI Speech 現在具有語音分析和通用翻譯功能。 Azure AI 搜尋現在顯著增加了儲存空間，向量索引大小增加了 12 倍，無需額外成本即可大規模支援大型 RAG 工作負載。

普拉迪普·維斯瓦夫

軟體和服務專家

Pradeep 是電腦科學與工程專業的畢業生。他還是微軟的學生夥伴。他目前在一家領先的 IT 公司工作。

使用者論壇

0消息

排序方式：