微軟宣布推出 Phi-3-vision,這是一個用於裝置上 AI 場景的新型多模式 SLM

閱讀時間圖標 1分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 閱讀更多

重點說明

  • Phi-3-vision是一個4.2B參數模型,支援一般視覺推理任務和圖表/圖形/表格推理

在 Build 2024 大會上,微軟今天 擴大 其 Phi-3 系列 AI 小語言模型具有新的 Phi-3-vision。 Phi-3-vision 是一個 4.2B 參數模型,支援一般視覺推理任務和圖表/圖形/表格推理。該模型可以將圖像和文字作為輸入,並輸出文字回應。

微軟今天也宣布 Phi-3-mini 在 Azure AI 的模型即服務 (MaaS) 產品中全面上市。 Phi-3 型號 由於它們具有成本效益並且針對設備上、邊緣、離線推理和延遲受限的 AI 場景進行了優化,因此正在獲得發展勢頭。

除了有關 Phi-3 模型的消息外,微軟還宣布了跨 API 的新功能,以實現多模式體驗。 Azure AI Speech 現在具有語音分析和通用翻譯功能。 Azure AI 搜尋現在顯著增加了儲存空間,向量索引大小增加了 12 倍,無需額外成本即可大規模支援大型 RAG 工作負載。

使用者論壇

0消息