Le nouveau modèle GPT-4o d'OpenAI bat Gemini et Claude pour établir de nouvelles références

Icône de temps de lecture 2 minute. lis


Les lecteurs aident à prendre en charge MSpoweruser. Nous pouvons recevoir une commission si vous achetez via nos liens. Icône d'info-bulle

Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale Je découvre le livre blanc

Modèle OpenAI GPT-4o

Aujourd'hui, OpenAI annoncé son dernier modèle phare, le GPT-4o. Le modèle GPT-4o (o fait référence à « omni ») est désormais disponible via API pour les développeurs. Le nouveau modèle GPT-4o est aussi intelligent que le GPT-4 Turbo, mais possède des capacités de vision améliorées et est beaucoup plus efficace.

OpenAI affirme que ce nouveau modèle est 2 fois plus rapide, 50 % moins cher et est livré avec des limites de débit 5 fois. Le GPT-4 Turbo coûtera 14 $ pour un million de jetons, tandis que le GPT-4o ne coûtera que 7 $ pour un million de jetons. Et oui, le modèle GPT-4o prendra en charge jusqu'à 10 millions de jetons par minute. L'API du modèle GPT-4o prendra en charge le texte et la vision pour le moment, et la prise en charge audio et vidéo sera bientôt disponible. En outre, le modèle a un contexte de 128 2023 et une limite de connaissances en octobre XNUMX.

Comment GPT-4o se comporte-t-il par rapport à Gemini et Claude ?

Ces derniers jours, OpenAI testait une version du modèle GPT-4o sur l'arène LMSys en tant que « im-also-a-good-gpt2-chatbot ». Comme vous pouvez le voir sur le tableau ci-dessus, GPT-4o est actuellement le meilleur modèle au monde et il est disponible gratuitement pour tous les utilisateurs de ChatGPT.

Le nouveau modèle GPT-4o établit également des records dans plusieurs tests d'IA standard. Découvrez-le ci-dessous.

ModèlePromptMMLUGPQAMATHHumanEvalMGSMGOUTTE
(F1,3-plan)
OPENAI GPT4
gpt-4ochat gpt188.753.676.690.290.583.4
gpt-4oassistant287.249.976.691.089.983.7
gpt-4-turbo-2024-04-09chat gpt86.549.172.287.688.685.4
gpt-4-turbo-2024-04-09assistant86.749.373.488.289.686.0
gpt-4-1106(-vision)-aperçuchat gpt84.642.164.182.286.581.3
gpt-4-1106(-vision)-aperçuassistant84.742.564.383.787.183.2
gpt-4-0125-aperçuchat gpt84.839.764.288.283.783.4
gpt-4-0125-aperçuassistant85.441.464.586.685.181.5
RÉFÉRENCE-REEXÉCUTION
Claude-3-Opus (relance avec API)vide384.149.763.284.889.779.0
Claude-3-Opus (relance avec API)lmsys484.250.763.882.989.277.1
Llama3 70b (réexécution avec API)vide80.241.352.870.182.681.4
RAPPORT DE RÉFÉRENCE(5 coups)
Claude-3-Opus (rapport5)inconnu86.850.460.184.990.783.1
Gemini-Ultra-1.0 (rapport6)inconnu83.7n/a53.274.479.082.4
Gemini-Pro-1.5 (rapport6)inconnu81.9n/a58.571.988.778.9
Lama3 8b (rapport7)inconnu68.434.230.062.2n/a58.4
Lama3 70b (rapport7)inconnu82.039.550.481.7n/a79.7
Llama3 400b (toujours en formation, rapport7)inconnu86.148.057.884.1n/a83.5

Les développeurs peuvent essayer le modèle GPT-4o sur Terrain de jeu OpenAI.

OpenAI demande au public de l'aider à identifier les tâches dans lesquelles GPT-4 Turbo surpasse encore GPT-4o, afin qu'il puisse continuer à améliorer le modèle.

Forum des utilisateurs

Messages 0