GPT-4 Turbo with Vision 现已在 API 中全面可用

视觉请求现在也可以使用 JSON 模式和函数调用。

阅读时间图标 2分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

重点说明

  • OpenAI 发布升级版 GPT-4 Turbo,具有更好的性能和视觉处理能力。
  • GPT-4 Turbo 拥有庞大的知识库和更便宜的处理成本。
  • OpenAI 预告了未来的技术:用于逼真语音的语音引擎和用于高级推理的 GPT-5。
OpenAI GPT-4 Turbo

OpenAI 发布了下一代语言模型 GPT-4 Turbo 与视觉 通过它的 API。此升级版本改进了以下功能 JSON模式 和 函数调用 用于视觉数据处理。该模型还承诺提高性能,并计划与流行的集成 ChatGPT.

什么是 GPT-4 Turbo?

GPT-4 Turbo 是一款能够处理文本和图像输入的多模式动力源。该模型利用其庞大的知识库和推理能力来提供输出。 OpenAI 去年 4 月首次发布了 GPT-2023 Turbo,强调了其扩展的知识(截至 128 年 300 月)和 XNUMXk 上下文窗口;这允许用户在单个提示中添加超过 XNUMX 页的文本。

GPT-4 Turbo 的真正优势在于其优化的性能,这意味着用户的成本大幅降低。与之前的模型相比,输入代币现在便宜三倍,而输出代币价格则为一半。此次升级使 GPT-4 Turbo 成为一种高效且经济高效的解决方案。

虽然 GPT-4 Turbo 占据了中心舞台,但 OpenAI 也预告了即将推出的 语音引擎,它能够仅通过文本输入和简短的音频样本(目前仅 15 秒)生成听起来自然的语音。然而,这项技术对于普通大众来说仍然遥不可及。

OpenAI 进一步暗示其下一个大模型 GPT-5 的到来,据说是 物质上更好。 你知道微软也 在 Copilot Pro 订阅中错误地调侃了 GPT-5 Turbo?