OpenAI:n uusi GPT-4o-malli päihittää Geminin ja Clauden asettaakseen uusia vertailuarvoja

Lukuajan kuvake 2 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

OpenAI GPT-4o malli

Tänään OpenAI ilmoitti sen uusin lippulaivamalli, GPT-4o. GPT-4o (o tarkoittaa "omni") -malli on nyt saatavilla API:n kautta kehittäjille. Uusi GPT-4o-malli on yhtä älykäs kuin GPT-4 Turbo, mutta siinä on parannetut näköominaisuudet ja se on paljon tehokkaampi.

OpenAI väittää, että tämä uusi malli on 2x nopeampi, 50% halvempi ja siinä on 5x nopeusrajoitukset. GPT-4 Turbo maksaa 14 dollaria miljoonasta rahakkeesta, kun taas GPT-4o maksaa vain 7 dollaria miljoonasta rahakkeesta. Ja kyllä, GPT-4o-malli tukee jopa 10 miljoonaa merkkiä minuutissa. GPT-4o-mallin sovellusliittymä tukee tekstiä ja visiota toistaiseksi, ja ääni- ja videotuki on tulossa pian. Lisäksi mallissa on 128 2023 konteksti ja lokakuun XNUMX tietoraja.

Miten GPT-4o toimii verrattuna Geminiin ja Claudeen?

Viime päivinä OpenAI testasi GPT-4o-mallin versiota LMSys-areenalla im-my-hy-a-good-gpt2-chatbotina. Kuten yllä olevasta kaaviosta näet, GPT-4o on tällä hetkellä maailman paras malli ja se on saatavilla ilmaiseksi kaikille ChatGPT-käyttäjille.

Uusi GPT-4o-malli tekee ennätyksen myös useissa tavallisissa tekoälyn mittareissa. Tarkista se alta.

MallinopeaMMLUGPQAMATEMATIIKKAHumanEvalMGSMDROP
(F1,3-laukaus)
OPENAI GPT4s
gpt-4ochat gpt188.753.676.690.290.583.4
gpt-4oavustaja287.249.976.691.089.983.7
gpt-4-turbo-2024-04-09chat gpt86.549.172.287.688.685.4
gpt-4-turbo-2024-04-09avustaja86.749.373.488.289.686.0
gpt-4-1106(-vision)-esikatseluchat gpt84.642.164.182.286.581.3
gpt-4-1106(-vision)-esikatseluavustaja84.742.564.383.787.183.2
gpt-4-0125-esikatseluchat gpt84.839.764.288.283.783.4
gpt-4-0125-esikatseluavustaja85.441.464.586.685.181.5
REFERENCE-RERUN
Claude-3-Opus (uudelleen apilla)tyhjä384.149.763.284.889.779.0
Claude-3-Opus (uudelleen apilla)lmsys484.250.763.882.989.277.1
Llama3 70b (uudelleen apilla)tyhjä80.241.352.870.182.681.4
VIITE-RAPORTTI(5 laukausta)
Claude-3-Opus (raportti5)tuntematon86.850.460.184.990.783.1
Gemini-Ultra-1.0 (raportti6)tuntematon83.7n / a53.274.479.082.4
Gemini-Pro-1.5 (raportti6)tuntematon81.9n / a58.571.988.778.9
Llama3 8b (raportti7)tuntematon68.434.230.062.2n / a58.4
Llama3 70b (raportti7)tuntematon82.039.550.481.7n / a79.7
Llama3 400b (harjoittelu edelleen, raportti7)tuntematon86.148.057.884.1n / a83.5

Kehittäjät voivat kokeilla GPT-4o-mallia osoitteessa OpenAI leikkikenttä.

OpenAI pyytää yleisöä auttamaan tunnistamaan tehtäviä, joissa GPT-4 Turbo on edelleen GPT-4o:ta parempi, jotta he voivat jatkaa mallin parantamista.

Lisää aiheista: GPT-4o, openAI