GPT-4 Turbo with Vision が API で一般公開されました

Vision リクエストでは、JSON モードと関数呼び出しも使用できるようになりました。

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

キーノート

  • OpenAI は、より優れたパフォーマンスとビジョン処理を備えたアップグレードされた GPT-4 Turbo をリリースします。
  • GPT-4 Turbo は、膨大な知識ベースと安価な処理コストを誇ります。
  • OpenAI は、現実的な音声を実現する音声エンジンと、高度な推論を実現する GPT-5 という将来のテクノロジーを紹介します。
OpenAI GPT-4 ターボ

OpenAI は、のリリースにより次世代の言語モデルを明らかにしました。 GPT-4 ターボ (ビジョン付き) その API を通じて。このアップグレードバージョンでは、次のような機能が向上しています。 JSONモード および 関数呼び出し ビジュアルデータ処理用。このモデルはパフォーマンスの向上も約束しており、人気のあるモデルと統合される予定です。 AI言語モデルを活用してコードのデバッグからデータの異常検出まで、.

GPT-4ターボとは何ですか?

GPT-4 Turbo は、テキストと画像の両方の入力を処理できるマルチモーダルな強力なツールです。このモデルは、その膨大な知識ベースと推論能力を使用して出力を提供します。 OpenAI は昨年 4 月に GPT-2023 Turbo を初めて公開し、その拡張された知識 (128 年 300 月まで) と大きな XNUMXk コンテキスト ウィンドウを強調しました。これにより、ユーザーは XNUMX つのプロンプトに XNUMX ページを超えるテキストを追加できます。

GPT-4 Turbo の本当の利点は、最適化されたパフォーマンスにあり、ユーザーの大幅なコスト削減につながります。以前のモデルと比較して、入力トークンは 4 倍安くなり、出力トークンは半額で提供されます。このアップグレードにより、GPT-XNUMX Turbo は効率的でコスト効率の高いソリューションになります。

GPT-4 Turbo が注目を集める一方、OpenAI も今後の GPT-XNUMX Turbo の予告を予告しました 音声エンジン、テキスト入力と短い音声サンプル (現時点ではわずか 15 秒) だけから自然な音声の音声を生成できます。しかし、この技術はまだ一般の人には手の届かないものです。

OpenAIはさらに、次の大型モデルであるGPT-5の登場を示唆した。 物質的には良くなりました。 そしてマイクロソフトも Copilot Pro サブスクリプションで GPT-5 Turbo を誤ってからかったことがありますか?

ユーザーフォーラム

0メッセージ