Azure OpenAI サービス経由で GPT-4 Turbo を Vision で使用できるのに、Gemini Ultra を待つ必要はありません

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

OpenAI GPT-4 Turbo 対 Gemini Ultra

OpenAI GPT-4 ターボ (ビジョン付き) は、画像を分析し、画像に関する質問に対してテキストによる回答を提供できる大規模なマルチモーダル モデル (LMM) です。 この高度なマルチモーダル AI モデルには、GPT-4 Turbo のすべての機能が含まれていると同時に、画像入力を処理および分析する機能が追加されています。 

今日、マイクロソフト 発表の GPT-4 Turbo with Vision は Azure OpenAI サービス経由で利用できるようになりました。 オーストラリア東部、スウェーデン中部、スイス北部、米国西部の Azure リージョンの既存の Azure OpenAI Service 顧客は、GPT-4 Turbo with Vision サービスにアクセスできるようになりました。

GPT-4 Turbo with Vision の利用可能化に伴い、Microsoft は高度な機能を可能にする Azure AI サービスの次の改善を発表します。

  • 光学式文字認識(OCR): 画像からテキストを抽出し、それをユーザーのプロンプトおよび画像と統合してコンテキストを充実させます。 
  • 物体接地: 画像内の主要なオブジェクトを識別して輪郭を描くことで、GPT-4 Turbo with Vision からのテキスト応答を強化します。 
  • ビデオプロンプト: GPT-4 Turbo with Vision が、ユーザーのプロンプトに基づいてビデオから最も関連性の高いフレームを使用して質問に回答できるようにします。 
  • 画像を含むデータに対する Azure OpenAI サービス: GPT-4 Turbo と Vision、Azure AI Search、Azure AI Vision を組み合わせることで、画像にテキスト データを追加できるようになり、ベクトル検索を利用してユーザーのデータと接続するソリューションを開発し、チャット エクスペリエンスの向上を実現します。

GPT-4 Turbo with Vision on Azure OpenAI サービスは、入力トークンと出力トークンの数に基づいて課金されます。 詳細は以下をご覧ください。

モデル入力 出力 
GPT-4 ターボ (ビジョン付き)10.01 トークンあたり $10000.03 トークンあたり $1000
+ OCR 用の強化されたアドオン機能1.50 トランザクションあたり 1000 ドル
+ オブジェクト接地のための拡張されたアドオン機能1.50 トランザクションあたり 1000 ドル
+ 「画像を追加」画像埋め込み用の拡張アドオン機能0.10 トランザクションあたり 1000 ドル
+ ビデオ検索を統合するビデオ プロンプトの拡張アドオン機能インデックス作成の場合は 0.05 分あたり 0.25 ドル、トランザクション 1000 件あたり XNUMX ドル2

今週初め、Microsoft Research チームは 明らかになった 新しいプロンプト技術を使用すると、OpenAI の GPT-4 モデルが Google Gemini Ultra に勝てるということです。 したがって、Gemini Ultra を待っている場合は、ぜひ GPT-4 Turbo with Vision を試してみてください。

トピックの詳細: GPT-4 ターボ (ビジョン付き), マイクロソフト, オープンAI