Microsoft、オンデバイス AI シナリオ向けの新しいマルチモーダル SLM である Phi-3-vision を発表
1分。 読んだ
更新日
MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む
キーノート
- Phi-3-vision は、一般的な視覚推論タスクとチャート/グラフ/表推論をサポートする 4.2B パラメーター モデルです。
Build 2024 における Microsoft の今日の姿 拡大 新しい Phi-3 ビジョンを備えた AI 小型言語モデルの Phi-3 ファミリー。 Phi-3-vision は、一般的な視覚推論タスクとチャート/グラフ/表推論をサポートする 4.2B パラメーター モデルです。モデルは画像とテキストの両方を入力として受け取り、テキスト応答を出力できます。
Microsoft は本日、Azure AI の Models-as-a Service (MaaS) オファリングにおける Phi-3-mini の一般提供も発表しました。 ファイ-3モデル コスト効率が高く、オンデバイス、エッジ、オフライン推論、レイテンシー制約のある AI シナリオに最適化されているため、勢いが増しています。
Phi-3 モデルに関するニュースに加えて、Microsoft はマルチモーダル エクスペリエンスを可能にする API 全体の新機能を発表しました。 Azure AI Speech には音声分析とユニバーサル翻訳が追加されました。 Azure AI Search には、ストレージが大幅に増加し、追加コストなしでベクトル インデックス サイズが最大 12 倍に増加し、大規模な RAG ワークロードが可能になりました。
ユーザーフォーラム
0メッセージ