O novo modelo GPT-4o da OpenAI supera Gemini e Claude para estabelecer novos padrões
2 minutos. ler
Atualizado em
Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais
Hoje, OpenAI anunciou seu mais recente modelo principal, GPT-4o. O modelo GPT-4o (o refere-se a 'omni') agora está disponível via API para desenvolvedores. O novo modelo GPT-4o é tão inteligente quanto o GPT-4 Turbo, mas possui capacidades de visão aprimoradas e é muito mais eficiente.
A OpenAI afirma que este novo modelo é 2x mais rápido, 50% mais barato e vem com limites de taxa de 5x. O GPT-4 Turbo custará US$ 14 por milhão de tokens, enquanto o GPT-4o custará apenas US$ 7 por milhão de tokens. E sim, o modelo GPT-4o suportará até 10 milhões de tokens por minuto. A API do modelo GPT-4o oferecerá suporte a texto e visão por enquanto, com suporte a áudio e vídeo em breve. Além disso, o modelo tem contexto de 128K e limite de conhecimento de outubro de 2023.
Qual é o desempenho do GPT-4o em comparação com Gemini e Claude?
Nos últimos dias, a OpenAI estava testando uma versão do modelo GPT-4o na arena LMSys como im-also-a-good-gpt2-chatbot. Como você pode ver no gráfico acima, o GPT-4o é o melhor modelo do mundo no momento e está disponível gratuitamente para todos os usuários do ChatGPT.
O novo modelo GPT-4o também bate recordes em vários benchmarks padrão de IA. Confira abaixo.
Modelo | Prompt | MMLU | GPQA | MATEMÁTICA | Avaliação Humana | MGSM | GOTA (Tiro F1,3) |
---|---|---|---|---|---|---|---|
OPENAI GPT4 | |||||||
gpt-4o | chat gpt1 | 88.7 | 53.6 | 76.6 | 90.2 | 90.5 | 83.4 |
gpt-4o | assistente2 | 87.2 | 49.9 | 76.6 | 91.0 | 89.9 | 83.7 |
gpt-4-turbo-2024-04-09 | chat gpt | 86.5 | 49.1 | 72.2 | 87.6 | 88.6 | 85.4 |
gpt-4-turbo-2024-04-09 | assistente | 86.7 | 49.3 | 73.4 | 88.2 | 89.6 | 86.0 |
gpt-4-1106(-visão)-visualização | chat gpt | 84.6 | 42.1 | 64.1 | 82.2 | 86.5 | 81.3 |
gpt-4-1106(-visão)-visualização | assistente | 84.7 | 42.5 | 64.3 | 83.7 | 87.1 | 83.2 |
gpt-4-0125-visualização | chat gpt | 84.8 | 39.7 | 64.2 | 88.2 | 83.7 | 83.4 |
gpt-4-0125-visualização | assistente | 85.4 | 41.4 | 64.5 | 86.6 | 85.1 | 81.5 |
REFERÊNCIA-RERUN | |||||||
Claude-3-Opus (repetição com API) | vazio3 | 84.1 | 49.7 | 63.2 | 84.8 | 89.7 | 79.0 |
Claude-3-Opus (repetição com API) | lmsys4 | 84.2 | 50.7 | 63.8 | 82.9 | 89.2 | 77.1 |
Llama3 70b (nova execução com API) | vazio | 80.2 | 41.3 | 52.8 | 70.1 | 82.6 | 81.4 |
RELATÓRIO DE REFERÊNCIA | (5 tiros) | ||||||
Claude-3-Opus (relatório5) | desconhecido | 86.8 | 50.4 | 60.1 | 84.9 | 90.7 | 83.1 |
Gemini-Ultra-1.0 (relatório6) | desconhecido | 83.7 | não aplicável | 53.2 | 74.4 | 79.0 | 82.4 |
Gemini-Pro-1.5 (relatório6) | desconhecido | 81.9 | não aplicável | 58.5 | 71.9 | 88.7 | 78.9 |
Lhama3 8b (relatório7) | desconhecido | 68.4 | 34.2 | 30.0 | 62.2 | não aplicável | 58.4 |
Lhama3 70b (relatório7) | desconhecido | 82.0 | 39.5 | 50.4 | 81.7 | não aplicável | 79.7 |
Llama3 400b (ainda treinando, relatório7) | desconhecido | 86.1 | 48.0 | 57.8 | 84.1 | não aplicável | 83.5 |
Os desenvolvedores podem experimentar o modelo GPT-4o em Parque OpenAI.
A OpenAI está pedindo ao público que ajude a identificar tarefas em que o GPT-4 Turbo ainda supera o GPT-4o, para que possam continuar a melhorar o modelo.
Fórum de usuários
Mensagens 0