GPT-4 Turbo with Vision 现已在 API 中全面可用

视觉请求现在也可以使用 JSON 模式和函数调用。

首页 » 新闻与博客

2分钟读

发表于 2024 年 4 月 10 日

by 德韦什·贝里

发表于 2024 年 4 月 10 日

分享此文章

改进本指南

读者帮助支持 MSpoweruser。如果您通过我们的链接购买，我们可能会获得佣金。

重点说明

OpenAI 发布升级版 GPT-4 Turbo，具有更好的性能和视觉处理能力。
GPT-4 Turbo 拥有庞大的知识库和更便宜的处理成本。
OpenAI 预告了未来的技术：用于逼真语音的语音引擎和用于高级推理的 GPT-5。

OpenAI 发布了下一代语言模型 GPT-4 Turbo 与视觉 通过它的 API。此升级版本改进了以下功能 JSON模式 和 函数调用 用于视觉数据处理。该模型还承诺提高性能，并计划与流行的集成 ChatGPT.

重大改进的 GPT-4 Turbo 模型现已在 API 中提供，并在 ChatGPT 中推出。 https://t.co/HMihypFusV
- OpenAI（@OpenAI） 2024 年 4 月 9 日

什么是 GPT-4 Turbo？

GPT-4 Turbo 是一款能够处理文本和图像输入的多模式动力源。该模型利用其庞大的知识库和推理能力来提供输出。 OpenAI 去年 4 月首次发布了 GPT-2023 Turbo，强调了其扩展的知识（截至 128 年 300 月）和 XNUMXk 上下文窗口；这允许用户在单个提示中添加超过 XNUMX 页的文本。

GPT-4 Turbo 的真正优势在于其优化的性能，这意味着用户的成本大幅降低。与之前的模型相比，输入代币现在便宜三倍，而输出代币价格则为一半。此次升级使 GPT-4 Turbo 成为一种高效且经济高效的解决方案。

虽然 GPT-4 Turbo 占据了中心舞台，但 OpenAI 也预告了即将推出的 语音引擎，它能够仅通过文本输入和简短的音频样本（目前仅 15 秒）生成听起来自然的语音。然而，这项技术对于普通大众来说仍然遥不可及。

OpenAI 进一步暗示其下一个大模型 GPT-5 的到来，据说是 “物质上更好。“ 你知道微软也在 Copilot Pro 订阅中错误地调侃了 GPT-5 Turbo？