Le nouveau modèle GPT-4o d'OpenAI bat Gemini et Claude pour établir de nouvelles références
2 minute. lis
Mis à jour le
Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale Je découvre le livre blanc
Aujourd'hui, OpenAI annoncé son dernier modèle phare, le GPT-4o. Le modèle GPT-4o (o fait référence à « omni ») est désormais disponible via API pour les développeurs. Le nouveau modèle GPT-4o est aussi intelligent que le GPT-4 Turbo, mais possède des capacités de vision améliorées et est beaucoup plus efficace.
OpenAI affirme que ce nouveau modèle est 2 fois plus rapide, 50 % moins cher et est livré avec des limites de débit 5 fois. Le GPT-4 Turbo coûtera 14 $ pour un million de jetons, tandis que le GPT-4o ne coûtera que 7 $ pour un million de jetons. Et oui, le modèle GPT-4o prendra en charge jusqu'à 10 millions de jetons par minute. L'API du modèle GPT-4o prendra en charge le texte et la vision pour le moment, et la prise en charge audio et vidéo sera bientôt disponible. En outre, le modèle a un contexte de 128 2023 et une limite de connaissances en octobre XNUMX.
Comment GPT-4o se comporte-t-il par rapport à Gemini et Claude ?
Ces derniers jours, OpenAI testait une version du modèle GPT-4o sur l'arène LMSys en tant que « im-also-a-good-gpt2-chatbot ». Comme vous pouvez le voir sur le tableau ci-dessus, GPT-4o est actuellement le meilleur modèle au monde et il est disponible gratuitement pour tous les utilisateurs de ChatGPT.
Le nouveau modèle GPT-4o établit également des records dans plusieurs tests d'IA standard. Découvrez-le ci-dessous.
Modèle | Prompt | MMLU | GPQA | MATH | HumanEval | MGSM | GOUTTE (F1,3-plan) |
---|---|---|---|---|---|---|---|
OPENAI GPT4 | |||||||
gpt-4o | chat gpt1 | 88.7 | 53.6 | 76.6 | 90.2 | 90.5 | 83.4 |
gpt-4o | assistant2 | 87.2 | 49.9 | 76.6 | 91.0 | 89.9 | 83.7 |
gpt-4-turbo-2024-04-09 | chat gpt | 86.5 | 49.1 | 72.2 | 87.6 | 88.6 | 85.4 |
gpt-4-turbo-2024-04-09 | assistant | 86.7 | 49.3 | 73.4 | 88.2 | 89.6 | 86.0 |
gpt-4-1106(-vision)-aperçu | chat gpt | 84.6 | 42.1 | 64.1 | 82.2 | 86.5 | 81.3 |
gpt-4-1106(-vision)-aperçu | assistant | 84.7 | 42.5 | 64.3 | 83.7 | 87.1 | 83.2 |
gpt-4-0125-aperçu | chat gpt | 84.8 | 39.7 | 64.2 | 88.2 | 83.7 | 83.4 |
gpt-4-0125-aperçu | assistant | 85.4 | 41.4 | 64.5 | 86.6 | 85.1 | 81.5 |
RÉFÉRENCE-REEXÉCUTION | |||||||
Claude-3-Opus (relance avec API) | vide3 | 84.1 | 49.7 | 63.2 | 84.8 | 89.7 | 79.0 |
Claude-3-Opus (relance avec API) | lmsys4 | 84.2 | 50.7 | 63.8 | 82.9 | 89.2 | 77.1 |
Llama3 70b (réexécution avec API) | vide | 80.2 | 41.3 | 52.8 | 70.1 | 82.6 | 81.4 |
RAPPORT DE RÉFÉRENCE | (5 coups) | ||||||
Claude-3-Opus (rapport5) | inconnu | 86.8 | 50.4 | 60.1 | 84.9 | 90.7 | 83.1 |
Gemini-Ultra-1.0 (rapport6) | inconnu | 83.7 | n/a | 53.2 | 74.4 | 79.0 | 82.4 |
Gemini-Pro-1.5 (rapport6) | inconnu | 81.9 | n/a | 58.5 | 71.9 | 88.7 | 78.9 |
Lama3 8b (rapport7) | inconnu | 68.4 | 34.2 | 30.0 | 62.2 | n/a | 58.4 |
Lama3 70b (rapport7) | inconnu | 82.0 | 39.5 | 50.4 | 81.7 | n/a | 79.7 |
Llama3 400b (toujours en formation, rapport7) | inconnu | 86.1 | 48.0 | 57.8 | 84.1 | n/a | 83.5 |
Les développeurs peuvent essayer le modèle GPT-4o sur Terrain de jeu OpenAI.
OpenAI demande au public de l'aider à identifier les tâches dans lesquelles GPT-4 Turbo surpasse encore GPT-4o, afin qu'il puisse continuer à améliorer le modèle.
Forum des utilisateurs
Messages 0