GPT-4 Turbo with Vision が API で一般公開されました

Vision リクエストでは、JSON モードと関数呼び出しも使用できるようになりました。

ホーム » ニュース

2分。読んだ

上で公開 2024 年 4 月 10 日

by デベシュ・ベリ

上の公表 2024 年 4 月 10 日

この記事を共有する

このガイドを改善する

読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。

キーノート

OpenAI は、より優れたパフォーマンスとビジョン処理を備えたアップグレードされた GPT-4 Turbo をリリースします。
GPT-4 Turbo は、膨大な知識ベースと安価な処理コストを誇ります。
OpenAI は、現実的な音声を実現する音声エンジンと、高度な推論を実現する GPT-5 という将来のテクノロジーを紹介します。

OpenAI は、のリリースにより次世代の言語モデルを明らかにしました。 GPT-4 ターボ (ビジョン付き) その API を通じて。このアップグレードバージョンでは、次のような機能が向上しています。 JSONモード および 関数呼び出し ビジュアルデータ処理用。このモデルはパフォーマンスの向上も約束しており、人気のあるモデルと統合される予定です。 AI言語モデルを活用してコードのデバッグからデータの異常検出まで、.

大幅に改良された GPT-4 Turbo モデルが API で利用可能になり、ChatGPT で展開されます。 https://t.co/HMihypFusV
- OpenAI（@OpenAI） 2024 年 4 月 9 日

GPT-4ターボとは何ですか？

GPT-4 Turbo は、テキストと画像の両方の入力を処理できるマルチモーダルな強力なツールです。このモデルは、その膨大な知識ベースと推論能力を使用して出力を提供します。 OpenAI は昨年 4 月に GPT-2023 Turbo を初めて公開し、その拡張された知識 (128 年 300 月まで) と大きな XNUMXk コンテキストウィンドウを強調しました。これにより、ユーザーは XNUMX つのプロンプトに XNUMX ページを超えるテキストを追加できます。

GPT-4 Turbo の本当の利点は、最適化されたパフォーマンスにあり、ユーザーの大幅なコスト削減につながります。以前のモデルと比較して、入力トークンは 4 倍安くなり、出力トークンは半額で提供されます。このアップグレードにより、GPT-XNUMX Turbo は効率的でコスト効率の高いソリューションになります。

GPT-4 Turbo が注目を集める一方、OpenAI も今後の GPT-XNUMX Turbo の予告を予告しました 音声エンジン、テキスト入力と短い音声サンプル (現時点ではわずか 15 秒) だけから自然な音声の音声を生成できます。しかし、この技術はまだ一般の人には手の届かないものです。

OpenAIはさらに、次の大型モデルであるGPT-5の登場を示唆した。 「物質的には良くなりました。「 そしてマイクロソフトも Copilot Pro サブスクリプションで GPT-5 Turbo を誤ってからかったことがありますか?