GPT-4 Turbo with Vision が API で一般公開されました
Vision リクエストでは、JSON モードと関数呼び出しも使用できるようになりました。
2分。 読んだ
上で公開
MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む
キーノート
- OpenAI は、より優れたパフォーマンスとビジョン処理を備えたアップグレードされた GPT-4 Turbo をリリースします。
- GPT-4 Turbo は、膨大な知識ベースと安価な処理コストを誇ります。
- OpenAI は、現実的な音声を実現する音声エンジンと、高度な推論を実現する GPT-5 という将来のテクノロジーを紹介します。
OpenAI は、のリリースにより次世代の言語モデルを明らかにしました。 GPT-4 ターボ (ビジョン付き) その API を通じて。このアップグレードバージョンでは、次のような機能が向上しています。 JSONモード および 関数呼び出し ビジュアルデータ処理用。このモデルはパフォーマンスの向上も約束しており、人気のあるモデルと統合される予定です。 AI言語モデルを活用してコードのデバッグからデータの異常検出まで、.
GPT-4ターボとは何ですか?
GPT-4 Turbo は、テキストと画像の両方の入力を処理できるマルチモーダルな強力なツールです。このモデルは、その膨大な知識ベースと推論能力を使用して出力を提供します。 OpenAI は昨年 4 月に GPT-2023 Turbo を初めて公開し、その拡張された知識 (128 年 300 月まで) と大きな XNUMXk コンテキスト ウィンドウを強調しました。これにより、ユーザーは XNUMX つのプロンプトに XNUMX ページを超えるテキストを追加できます。
GPT-4 Turbo の本当の利点は、最適化されたパフォーマンスにあり、ユーザーの大幅なコスト削減につながります。以前のモデルと比較して、入力トークンは 4 倍安くなり、出力トークンは半額で提供されます。このアップグレードにより、GPT-XNUMX Turbo は効率的でコスト効率の高いソリューションになります。
GPT-4 Turbo が注目を集める一方、OpenAI も今後の GPT-XNUMX Turbo の予告を予告しました 音声エンジン、テキスト入力と短い音声サンプル (現時点ではわずか 15 秒) だけから自然な音声の音声を生成できます。しかし、この技術はまだ一般の人には手の届かないものです。
OpenAIはさらに、次の大型モデルであるGPT-5の登場を示唆した。 「物質的には良くなりました。「 そしてマイクロソフトも Copilot Pro サブスクリプションで GPT-5 Turbo を誤ってからかったことがありますか?
ユーザーフォーラム
0メッセージ