Новая модель OpenAI GPT-4o превосходит Gemini и Claude и устанавливает новые стандарты
2 минута. читать
Опубликовано
Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее
![Модель OpenAI GPT-4o](https://mspoweruser.com/wp-content/uploads/2024/05/OpenAI-GPT-4o-model-700x368.png)
Сегодня ОпенАИ было объявлено его последняя флагманская модель GPT-4o. Модель GPT-4o (o означает «omni») теперь доступна для разработчиков через API. Новая модель GPT-4o так же умна, как GPT-4 Turbo, но имеет улучшенные возможности обзора и гораздо более эффективна.
OpenAI утверждает, что эта новая модель в 2 раза быстрее, на 50% дешевле и имеет пятикратные ограничения скорости. GPT-5 Turbo будет стоить 4 долларов за миллион токенов, тогда как GPT-14o будет стоить всего 4 долларов за миллион токенов. И да, модель GPT-7o будет поддерживать до 4 миллионов токенов в минуту. API модели GPT-10o на данный момент будет поддерживать текст и изображение, а поддержка аудио и видео появится в ближайшее время. Кроме того, модель имеет контекст 4 КБ и ограничение знаний в октябре 128 года.
Как GPT-4o работает по сравнению с Gemini и Claude?
![](https://mspoweruser.com/wp-content/uploads/2024/05/GPT-4o-ELO-benchmarks-1200x674.jpg)
В течение последних нескольких дней OpenAI тестировала версию модели GPT-4o на арене LMSys в качестве чат-бота «я тоже хороший gpt2». Как видно из диаграммы выше, GPT-4o на данный момент является лучшей моделью в мире, и она доступна бесплатно для всех пользователей ChatGPT.
Новая модель GPT-4o также устанавливает рекорды в нескольких стандартных тестах искусственного интеллекта. Проверьте это ниже.
Модель | Незамедлительный | ММЛУ | GPQA | МАТЕМАТИКА | HumanEval | МГСМ | DROP (F1,3-выстрел) |
---|---|---|---|---|---|---|---|
ОПЕНАЙ GPT4 | |||||||
gpt-4o | чат1 | 88.7 | 53.6 | 76.6 | 90.2 | 90.5 | 83.4 |
gpt-4o | помощник2 | 87.2 | 49.9 | 76.6 | 91.0 | 89.9 | 83.7 |
gpt-4-турбо-2024 | чат | 86.5 | 49.1 | 72.2 | 87.6 | 88.6 | 85.4 |
gpt-4-турбо-2024 | помощник | 86.7 | 49.3 | 73.4 | 88.2 | 89.6 | 86.0 |
gpt-4-1106(-vision)-предварительный просмотр | чат | 84.6 | 42.1 | 64.1 | 82.2 | 86.5 | 81.3 |
gpt-4-1106(-vision)-предварительный просмотр | помощник | 84.7 | 42.5 | 64.3 | 83.7 | 87.1 | 83.2 |
gpt-4-0125-предварительный просмотр | чат | 84.8 | 39.7 | 64.2 | 88.2 | 83.7 | 83.4 |
gpt-4-0125-предварительный просмотр | помощник | 85.4 | 41.4 | 64.5 | 86.6 | 85.1 | 81.5 |
ССЫЛКА-ПОВТОРЕНИЕ | |||||||
Клод-3-Опус (повтор с API) | пустой3 | 84.1 | 49.7 | 63.2 | 84.8 | 89.7 | 79.0 |
Клод-3-Опус (повтор с API) | lmsys4 | 84.2 | 50.7 | 63.8 | 82.9 | 89.2 | 77.1 |
Llama3 70b (повторный запуск с API) | пустой | 80.2 | 41.3 | 52.8 | 70.1 | 82.6 | 81.4 |
СПРАВКА-ОТЧЕТ | (5 выстрелов) | ||||||
Клод-3-Опус (отчёт5) | неизвестный | 86.8 | 50.4 | 60.1 | 84.9 | 90.7 | 83.1 |
Близнецы-Ультра-1.0 (отчет6) | неизвестный | 83.7 | н / | 53.2 | 74.4 | 79.0 | 82.4 |
Близнецы-Про-1.5 (отчет6) | неизвестный | 81.9 | н / | 58.5 | 71.9 | 88.7 | 78.9 |
Лама3 8б (отчет7) | неизвестный | 68.4 | 34.2 | 30.0 | 62.2 | н / | 58.4 |
Лама3 70б (отчет7) | неизвестный | 82.0 | 39.5 | 50.4 | 81.7 | н / | 79.7 |
Llama3 400b (все еще тренируется, отчет7) | неизвестный | 86.1 | 48.0 | 57.8 | 84.1 | н / | 83.5 |
Разработчики могут опробовать модель GPT-4o на сайте Игровая площадка OpenAI.
OpenAI просит общественность помочь определить задачи, в которых GPT-4 Turbo по-прежнему превосходит GPT-4o, чтобы они могли продолжать совершенствовать модель.