OpenAI's nieuwe GPT-4o-model verslaat Gemini en Claude en zet nieuwe benchmarks

Pictogram voor leestijd 2 minuut. lezen


Lezers helpen MSpoweruser ondersteunen. We kunnen een commissie krijgen als u via onze links koopt. Tooltip-pictogram

Lees onze openbaarmakingspagina om erachter te komen hoe u MSPoweruser kunt helpen het redactieteam te ondersteunen Lees meer

OpenAI GPT-4o-model

Vandaag Open AI aangekondigd zijn nieuwste vlaggenschipmodel, GPT-4o. Het GPT-4o-model (o verwijst naar 'omni') is nu via API beschikbaar voor ontwikkelaars. Het nieuwe GPT-4o-model is net zo slim als de GPT-4 Turbo, maar heeft verbeterde zichtmogelijkheden en is veel efficiënter.

OpenAI beweert dat dit nieuwe model 2x sneller, 50% goedkoper is en wordt geleverd met 5x tarieflimieten. De GPT-4 Turbo kost $14 voor miljoen tokens, terwijl de GPT-4o slechts $7 voor miljoen tokens kost. En ja, het GPT-4o-model ondersteunt tot 10 miljoen tokens per minuut. De GPT-4o-model-API ondersteunt voorlopig tekst en beeld, en binnenkort ook audio- en video-ondersteuning. Het model heeft ook een context van 128K en een kennislimiet van oktober 2023.

Hoe presteert GPT-4o in vergelijking met Gemini en Claude?

De afgelopen dagen testte OpenAI een versie van het GPT-4o-model op de LMSys-arena als een goede gpt2-chatbot. Zoals je in de bovenstaande grafiek kunt zien, is GPT-4o op dit moment het beste model ter wereld en is het gratis beschikbaar voor alle ChatGPT-gebruikers.

Het nieuwe GPT-4o-model vestigt ook een record in verschillende standaard AI-benchmarks. Bekijk het hieronder.

ModelpromptMMLUGPQAWISKUNDEMenselijkEvalMGSMDROP
(F1,3-opname)
OPENAI GPT4's
gpt-4ochat gpt188.753.676.690.290.583.4
gpt-4oassistent287.249.976.691.089.983.7
gpt-4-turbo-2024-04-09chat gpt86.549.172.287.688.685.4
gpt-4-turbo-2024-04-09assistent86.749.373.488.289.686.0
gpt-4-1106(-visie)-previewchat gpt84.642.164.182.286.581.3
gpt-4-1106(-visie)-previewassistent84.742.564.383.787.183.2
gpt-4-0125-previewchat gpt84.839.764.288.283.783.4
gpt-4-0125-previewassistent85.441.464.586.685.181.5
REFERENTIE-HERHALING
Claude-3-Opus (herhaling met API)leeg384.149.763.284.889.779.0
Claude-3-Opus (herhaling met API)lmsys484.250.763.882.989.277.1
Llama3 70b (herhaling met API)leeg80.241.352.870.182.681.4
REFERENTIE-RAPPORT(5-schots)
Claude-3-Opus (rapport5)onbekend86.850.460.184.990.783.1
Gemini-Ultra-1.0 (rapport6)onbekend83.7n / a53.274.479.082.4
Gemini-Pro-1.5 (rapport6)onbekend81.9n / a58.571.988.778.9
Lama3 8b (rapport7)onbekend68.434.230.062.2n / a58.4
Lama3 70b (rapport7)onbekend82.039.550.481.7n / a79.7
Llama3 400b (nog aan het trainen, rapport7)onbekend86.148.057.884.1n / a83.5

Ontwikkelaars kunnen het GPT-4o-model uitproberen op Open AI-speeltuin.

OpenAI vraagt ​​het publiek om te helpen bij het identificeren van taken waarbij GPT-4 Turbo nog steeds beter presteert dan GPT-4o, zodat ze het model kunnen blijven verbeteren.

Meer over de onderwerpen: GPT-4o, openAI

Laat een reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd *