OpenAI:n uusi GPT-4o-malli päihittää Geminin ja Clauden asettaakseen uusia vertailuarvoja
2 min. lukea
Julkaistu
Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää
Tänään OpenAI ilmoitti sen uusin lippulaivamalli, GPT-4o. GPT-4o (o tarkoittaa "omni") -malli on nyt saatavilla API:n kautta kehittäjille. Uusi GPT-4o-malli on yhtä älykäs kuin GPT-4 Turbo, mutta siinä on parannetut näköominaisuudet ja se on paljon tehokkaampi.
OpenAI väittää, että tämä uusi malli on 2x nopeampi, 50% halvempi ja siinä on 5x nopeusrajoitukset. GPT-4 Turbo maksaa 14 dollaria miljoonasta rahakkeesta, kun taas GPT-4o maksaa vain 7 dollaria miljoonasta rahakkeesta. Ja kyllä, GPT-4o-malli tukee jopa 10 miljoonaa merkkiä minuutissa. GPT-4o-mallin sovellusliittymä tukee tekstiä ja visiota toistaiseksi, ja ääni- ja videotuki on tulossa pian. Lisäksi mallissa on 128 2023 konteksti ja lokakuun XNUMX tietoraja.
Miten GPT-4o toimii verrattuna Geminiin ja Claudeen?
Viime päivinä OpenAI testasi GPT-4o-mallin versiota LMSys-areenalla im-my-hy-a-good-gpt2-chatbotina. Kuten yllä olevasta kaaviosta näet, GPT-4o on tällä hetkellä maailman paras malli ja se on saatavilla ilmaiseksi kaikille ChatGPT-käyttäjille.
Uusi GPT-4o-malli tekee ennätyksen myös useissa tavallisissa tekoälyn mittareissa. Tarkista se alta.
Malli | nopea | MMLU | GPQA | MATEMATIIKKA | HumanEval | MGSM | DROP (F1,3-laukaus) |
---|---|---|---|---|---|---|---|
OPENAI GPT4s | |||||||
gpt-4o | chat gpt1 | 88.7 | 53.6 | 76.6 | 90.2 | 90.5 | 83.4 |
gpt-4o | avustaja2 | 87.2 | 49.9 | 76.6 | 91.0 | 89.9 | 83.7 |
gpt-4-turbo-2024-04-09 | chat gpt | 86.5 | 49.1 | 72.2 | 87.6 | 88.6 | 85.4 |
gpt-4-turbo-2024-04-09 | avustaja | 86.7 | 49.3 | 73.4 | 88.2 | 89.6 | 86.0 |
gpt-4-1106(-vision)-esikatselu | chat gpt | 84.6 | 42.1 | 64.1 | 82.2 | 86.5 | 81.3 |
gpt-4-1106(-vision)-esikatselu | avustaja | 84.7 | 42.5 | 64.3 | 83.7 | 87.1 | 83.2 |
gpt-4-0125-esikatselu | chat gpt | 84.8 | 39.7 | 64.2 | 88.2 | 83.7 | 83.4 |
gpt-4-0125-esikatselu | avustaja | 85.4 | 41.4 | 64.5 | 86.6 | 85.1 | 81.5 |
REFERENCE-RERUN | |||||||
Claude-3-Opus (uudelleen apilla) | tyhjä3 | 84.1 | 49.7 | 63.2 | 84.8 | 89.7 | 79.0 |
Claude-3-Opus (uudelleen apilla) | lmsys4 | 84.2 | 50.7 | 63.8 | 82.9 | 89.2 | 77.1 |
Llama3 70b (uudelleen apilla) | tyhjä | 80.2 | 41.3 | 52.8 | 70.1 | 82.6 | 81.4 |
VIITE-RAPORTTI | (5 laukausta) | ||||||
Claude-3-Opus (raportti5) | tuntematon | 86.8 | 50.4 | 60.1 | 84.9 | 90.7 | 83.1 |
Gemini-Ultra-1.0 (raportti6) | tuntematon | 83.7 | n / a | 53.2 | 74.4 | 79.0 | 82.4 |
Gemini-Pro-1.5 (raportti6) | tuntematon | 81.9 | n / a | 58.5 | 71.9 | 88.7 | 78.9 |
Llama3 8b (raportti7) | tuntematon | 68.4 | 34.2 | 30.0 | 62.2 | n / a | 58.4 |
Llama3 70b (raportti7) | tuntematon | 82.0 | 39.5 | 50.4 | 81.7 | n / a | 79.7 |
Llama3 400b (harjoittelu edelleen, raportti7) | tuntematon | 86.1 | 48.0 | 57.8 | 84.1 | n / a | 83.5 |
Kehittäjät voivat kokeilla GPT-4o-mallia osoitteessa OpenAI leikkikenttä.
OpenAI pyytää yleisöä auttamaan tunnistamaan tehtäviä, joissa GPT-4 Turbo on edelleen GPT-4o:ta parempi, jotta he voivat jatkaa mallin parantamista.