Microsoft、オンデバイス AI シナリオ向けの新しいマルチモーダル SLM である Phi-3-vision を発表

読書時間アイコン 1分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

キーノート

  • Phi-3-vision は、一般的な視覚推論タスクとチャート/グラフ/表推論をサポートする 4.2B パラメーター モデルです。

Build 2024 における Microsoft の今日の姿 拡大 新しい Phi-3 ビジョンを備えた AI 小型言語モデルの Phi-3 ファミリー。 Phi-3-vision は、一般的な視覚推論タスクとチャート/グラフ/表推論をサポートする 4.2B パラメーター モデルです。モデルは画像とテキストの両方を入力として受け取り、テキスト応答を出力できます。

Microsoft は本日、Azure AI の Models-as-a Service (MaaS) オファリングにおける Phi-3-mini の一般提供も発表しました。 ファイ-3モデル コスト効率が高く、オンデバイス、エッジ、オフライン推論、レイテンシー制約のある AI シナリオに最適化されているため、勢いが増しています。

Phi-3 モデルに関するニュースに加えて、Microsoft はマルチモーダル エクスペリエンスを可能にする API 全体の新機能を発表しました。 Azure AI Speech には音声分析とユニバーサル翻訳が追加されました。 Azure AI Search には、ストレージが大幅に増加し、追加コストなしでベクトル インデックス サイズが最大 12 倍に増加し、大規模な RAG ワークロードが可能になりました。

ユーザーフォーラム

0メッセージ