Microsoft、オンデバイス AI シナリオ向けの新しいマルチモーダル SLM である Phi-3-vision を発表

ホーム » ニュース

1分。読んだ

更新日 2024 年 5 月 23 日

by プラディープ・ヴィスワフ

上の更新 2024 年 5 月 23 日

この記事を共有する

このガイドを改善する

読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。

キーノート

Phi-3-vision は、一般的な視覚推論タスクとチャート/グラフ/表推論をサポートする 4.2B パラメーターモデルです。

Build 2024 における Microsoft の今日の姿拡大新しい Phi-3 ビジョンを備えた AI 小型言語モデルの Phi-3 ファミリー。 Phi-3-vision は、一般的な視覚推論タスクとチャート/グラフ/表推論をサポートする 4.2B パラメーターモデルです。モデルは画像とテキストの両方を入力として受け取り、テキスト応答を出力できます。

Microsoft は本日、Azure AI の Models-as-a Service (MaaS) オファリングにおける Phi-3-mini の一般提供も発表しました。ファイ-3モデルコスト効率が高く、オンデバイス、エッジ、オフライン推論、レイテンシー制約のある AI シナリオに最適化されているため、勢いが増しています。

Phi-3 モデルに関するニュースに加えて、Microsoft はマルチモーダルエクスペリエンスを可能にする API 全体の新機能を発表しました。 Azure AI Speech には音声分析とユニバーサル翻訳が追加されました。 Azure AI Search には、ストレージが大幅に増加し、追加コストなしでベクトルインデックスサイズが最大 12 倍に増加し、大規模な RAG ワークロードが可能になりました。