Gemini Ultra 与 GPT 4：Google Gemini 如何在大多数基准测试中击败 OpenAI GPT-4

首页 » 新闻中心

2分钟读

更新 2024 年 9 月 25 日

更新于 2024 年 9 月 25 日

分享此文章

改进本指南

读者帮助支持 MSpoweruser。如果您通过我们的链接购买，我们可能会获得佣金。

谷歌的新语言模型Gemini其顶级模型 Gemini Ultra 在综合基准测试中的表现优于 OpenAI 的 GPT-4。从基于文本的任务到复杂的多媒体理解，Gemini 始终表现出卓越的性能。

基于文本的性能：

多步推理（Big-Bench Hard）： Gemini Ultra 超越了 GPT-4，展示了其遵循复杂指令并解决多步骤问题的能力。
阅读理解（下降）： Gemini 在理解文本的细微差别方面表现出色，在根据阅读段落准确提取信息和回答问题方面超过了 GPT-4。
日常任务的常识推理 (HellaSwag)： 虽然 GPT-4 在这一类别中击败了 Gemini，但这两种模型都表现出了将常识知识应用于日常情况的卓越能力。

多媒体处理：

图像相关任务： Gemini 在涉及图像处理的所有测试中均取得了优异成绩，展示了在大学水平推理、自然图像理解、OCR、文档理解、信息图表分析和视觉上下文中的数学推理方面的卓越能力。
视频处理： Gemini 在两项视频相关测试中取得了胜利，在英语字幕捕捉和视频问答方面表现出色。
音频处理： Gemini横扫音频测试，展现出卓越的自动语音翻译和识别性能。