Новая модель OpenAI GPT-4o превосходит Gemini и Claude и устанавливает новые стандарты

Значок времени чтения 2 минута. читать


Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам. Значок подсказки

Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее

Модель OpenAI GPT-4o

Сегодня ОпенАИ было объявлено его последняя флагманская модель GPT-4o. Модель GPT-4o (o означает «omni») теперь доступна для разработчиков через API. Новая модель GPT-4o так же умна, как GPT-4 Turbo, но имеет улучшенные возможности обзора и гораздо более эффективна.

OpenAI утверждает, что эта новая модель в 2 раза быстрее, на 50% дешевле и имеет пятикратные ограничения скорости. GPT-5 Turbo будет стоить 4 долларов за миллион токенов, тогда как GPT-14o будет стоить всего 4 долларов за миллион токенов. И да, модель GPT-7o будет поддерживать до 4 миллионов токенов в минуту. API модели GPT-10o на данный момент будет поддерживать текст и изображение, а поддержка аудио и видео появится в ближайшее время. Кроме того, модель имеет контекст 4 КБ и ограничение знаний в октябре 128 года.

Как GPT-4o работает по сравнению с Gemini и Claude?

В течение последних нескольких дней OpenAI тестировала версию модели GPT-4o на арене LMSys в качестве чат-бота «я тоже хороший gpt2». Как видно из диаграммы выше, GPT-4o на данный момент является лучшей моделью в мире, и она доступна бесплатно для всех пользователей ChatGPT.

Новая модель GPT-4o также устанавливает рекорды в нескольких стандартных тестах искусственного интеллекта. Проверьте это ниже.

МодельНезамедлительныйММЛУGPQAМАТЕМАТИКАHumanEvalМГСМDROP
(F1,3-выстрел)
ОПЕНАЙ GPT4
gpt-4oчат188.753.676.690.290.583.4
gpt-4oпомощник287.249.976.691.089.983.7
gpt-4-турбо-2024чат86.549.172.287.688.685.4
gpt-4-турбо-2024помощник86.749.373.488.289.686.0
gpt-4-1106(-vision)-предварительный просмотрчат84.642.164.182.286.581.3
gpt-4-1106(-vision)-предварительный просмотрпомощник84.742.564.383.787.183.2
gpt-4-0125-предварительный просмотрчат84.839.764.288.283.783.4
gpt-4-0125-предварительный просмотрпомощник85.441.464.586.685.181.5
ССЫЛКА-ПОВТОРЕНИЕ
Клод-3-Опус (повтор с API)пустой384.149.763.284.889.779.0
Клод-3-Опус (повтор с API)lmsys484.250.763.882.989.277.1
Llama3 70b (повторный запуск с API)пустой80.241.352.870.182.681.4
СПРАВКА-ОТЧЕТ(5 выстрелов)
Клод-3-Опус (отчёт5)неизвестный86.850.460.184.990.783.1
Близнецы-Ультра-1.0 (отчет6)неизвестный83.7н /53.274.479.082.4
Близнецы-Про-1.5 (отчет6)неизвестный81.9н /58.571.988.778.9
Лама3 8б (отчет7)неизвестный68.434.230.062.2н /58.4
Лама3 70б (отчет7)неизвестный82.039.550.481.7н /79.7
Llama3 400b (все еще тренируется, отчет7)неизвестный86.148.057.884.1н /83.5

Разработчики могут опробовать модель GPT-4o на сайте Игровая площадка OpenAI.

OpenAI просит общественность помочь определить задачи, в которых GPT-4 Turbo по-прежнему превосходит GPT-4o, чтобы они могли продолжать совершенствовать модель.

Подробнее о темах: ГПТ-4о, openAI