O novo modelo GPT-4o da OpenAI supera Gemini e Claude para estabelecer novos padrões

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Modelo OpenAI GPT-4o

Hoje, OpenAI anunciou seu mais recente modelo principal, GPT-4o. O modelo GPT-4o (o refere-se a 'omni') agora está disponível via API para desenvolvedores. O novo modelo GPT-4o é tão inteligente quanto o GPT-4 Turbo, mas possui capacidades de visão aprimoradas e é muito mais eficiente.

A OpenAI afirma que este novo modelo é 2x mais rápido, 50% mais barato e vem com limites de taxa de 5x. O GPT-4 Turbo custará US$ 14 por milhão de tokens, enquanto o GPT-4o custará apenas US$ 7 por milhão de tokens. E sim, o modelo GPT-4o suportará até 10 milhões de tokens por minuto. A API do modelo GPT-4o oferecerá suporte a texto e visão por enquanto, com suporte a áudio e vídeo em breve. Além disso, o modelo tem contexto de 128K e limite de conhecimento de outubro de 2023.

Qual é o desempenho do GPT-4o em comparação com Gemini e Claude?

Nos últimos dias, a OpenAI estava testando uma versão do modelo GPT-4o na arena LMSys como im-also-a-good-gpt2-chatbot. Como você pode ver no gráfico acima, o GPT-4o é o melhor modelo do mundo no momento e está disponível gratuitamente para todos os usuários do ChatGPT.

O novo modelo GPT-4o também bate recordes em vários benchmarks padrão de IA. Confira abaixo.

ModeloPromptMMLUGPQAMATEMÁTICAAvaliação HumanaMGSMGOTA
(Tiro F1,3)
OPENAI GPT4
gpt-4ochat gpt188.753.676.690.290.583.4
gpt-4oassistente287.249.976.691.089.983.7
gpt-4-turbo-2024-04-09chat gpt86.549.172.287.688.685.4
gpt-4-turbo-2024-04-09assistente86.749.373.488.289.686.0
gpt-4-1106(-visão)-visualizaçãochat gpt84.642.164.182.286.581.3
gpt-4-1106(-visão)-visualizaçãoassistente84.742.564.383.787.183.2
gpt-4-0125-visualizaçãochat gpt84.839.764.288.283.783.4
gpt-4-0125-visualizaçãoassistente85.441.464.586.685.181.5
REFERÊNCIA-RERUN
Claude-3-Opus (repetição com API)vazio384.149.763.284.889.779.0
Claude-3-Opus (repetição com API)lmsys484.250.763.882.989.277.1
Llama3 70b (nova execução com API)vazio80.241.352.870.182.681.4
RELATÓRIO DE REFERÊNCIA(5 tiros)
Claude-3-Opus (relatório5)desconhecido86.850.460.184.990.783.1
Gemini-Ultra-1.0 (relatório6)desconhecido83.7não aplicável53.274.479.082.4
Gemini-Pro-1.5 (relatório6)desconhecido81.9não aplicável58.571.988.778.9
Lhama3 8b (relatório7)desconhecido68.434.230.062.2não aplicável58.4
Lhama3 70b (relatório7)desconhecido82.039.550.481.7não aplicável79.7
Llama3 400b (ainda treinando, relatório7)desconhecido86.148.057.884.1não aplicável83.5

Os desenvolvedores podem experimentar o modelo GPT-4o em Parque OpenAI.

A OpenAI está pedindo ao público que ajude a identificar tarefas em que o GPT-4 Turbo ainda supera o GPT-4o, para que possam continuar a melhorar o modelo.

Fórum de usuários

Mensagens 0