Новая модель OpenAI GPT-4o превосходит Gemini и Claude и устанавливает новые стандарты

2 минута. читать

Опубликовано 13 мая 2024

Опубликован в 13 мая 2024

Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам.

Сегодня ОпенАИ было объявлено его последняя флагманская модель GPT-4o. Модель GPT-4o (o означает «omni») теперь доступна для разработчиков через API. Новая модель GPT-4o так же умна, как GPT-4 Turbo, но имеет улучшенные возможности обзора и гораздо более эффективна.

OpenAI утверждает, что эта новая модель в 2 раза быстрее, на 50% дешевле и имеет пятикратные ограничения скорости. GPT-5 Turbo будет стоить 4 долларов за миллион токенов, тогда как GPT-14o будет стоить всего 4 долларов за миллион токенов. И да, модель GPT-7o будет поддерживать до 4 миллионов токенов в минуту. API модели GPT-10o на данный момент будет поддерживать текст и изображение, а поддержка аудио и видео появится в ближайшее время. Кроме того, модель имеет контекст 4 КБ и ограничение знаний в октябре 128 года.

Как GPT-4o работает по сравнению с Gemini и Claude?

В течение последних нескольких дней OpenAI тестировала версию модели GPT-4o на арене LMSys в качестве чат-бота «я тоже хороший gpt2». Как видно из диаграммы выше, GPT-4o на данный момент является лучшей моделью в мире, и она доступна бесплатно для всех пользователей ChatGPT.

Новая модель GPT-4o также устанавливает рекорды в нескольких стандартных тестах искусственного интеллекта. Проверьте это ниже.

Модель	Незамедлительный	ММЛУ	GPQA	МАТЕМАТИКА	HumanEval	МГСМ	DROP (F1,3-выстрел)
ОПЕНАЙ GPT4
gpt-4o	чат¹	`88.7`	`53.6`	`76.6`	90.2	90.5	83.4
gpt-4o	помощник²	87.2	49.9	`76.6`	`91.0`	89.9	83.7
gpt-4-турбо-2024	чат	86.5	49.1	72.2	87.6	88.6	85.4
gpt-4-турбо-2024	помощник	86.7	49.3	73.4	88.2	89.6	`86.0`
gpt-4-1106(-vision)-предварительный просмотр	чат	84.6	42.1	64.1	82.2	86.5	81.3
gpt-4-1106(-vision)-предварительный просмотр	помощник	84.7	42.5	64.3	83.7	87.1	83.2
gpt-4-0125-предварительный просмотр	чат	84.8	39.7	64.2	88.2	83.7	83.4
gpt-4-0125-предварительный просмотр	помощник	85.4	41.4	64.5	86.6	85.1	81.5
ССЫЛКА-ПОВТОРЕНИЕ
Клод-3-Опус (повтор с API)	пустой³	84.1	49.7	63.2	84.8	89.7	79.0
Клод-3-Опус (повтор с API)	lmsys⁴	84.2	50.7	63.8	82.9	89.2	77.1
Llama3 70b (повторный запуск с API)	пустой	80.2	41.3	52.8	70.1	82.6	81.4
СПРАВКА-ОТЧЕТ		(5 выстрелов)
Клод-3-Опус (отчёт⁵)	неизвестный	86.8	50.4	60.1	84.9	`90.7`	83.1
Близнецы-Ультра-1.0 (отчет⁶)	неизвестный	83.7	н /	53.2	74.4	79.0	82.4
Близнецы-Про-1.5 (отчет⁶)	неизвестный	81.9	н /	58.5	71.9	88.7	78.9
Лама3 8б (отчет⁷)	неизвестный	68.4	34.2	30.0	62.2	н /	58.4
Лама3 70б (отчет⁷)	неизвестный	82.0	39.5	50.4	81.7	н /	79.7
Llama3 400b (все еще тренируется, отчет⁷)	неизвестный	86.1	48.0	57.8	84.1	н /	83.5

Разработчики могут опробовать модель GPT-4o на сайте Игровая площадка OpenAI.

OpenAI просит общественность помочь определить задачи, в которых GPT-4 Turbo по-прежнему превосходит GPT-4o, чтобы они могли продолжать совершенствовать модель.

Подробнее о темах: ГПТ-4о, openAI

Прадип Вишвав

Эксперт по программному обеспечению и услугам

Прадип — выпускник компьютерных наук и инженерии. Он также был студенческим партнером Microsoft. В настоящее время работает в ведущей IT-компании.