Claude 3 Opus voittaa OpenAI:n GPT-4:n tärkeässä chatbot-sijoituksessa

Etusivu » Uutiset

Lukuajan kuvake 2 min. lukea

Kalenterikuvake Julkaistu Maaliskuussa 28, 2024

by Rahul

Julkaistu Maaliskuussa 28, 2024

Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta.

Keskeiset huomautukset

Claude 3 Opus on voittanut OpenAI:n GPT-4:n ja noussut Arenan ykköseksi.
Claude 3 Opuksen Elo Score on 1253, mikä on hieman enemmän kuin GPT-4.
Tulokset perustuvat siihen, kuinka tyytyväisiä käyttäjät olivat useiden tekoälymallien tuotoksiin.

Antropinen julkisti Claude 3 -malliperheen aiemmin tässä kuussa väittäen, että se voi ylittää OpenAI:n GPT-4:n. Yritys osoitti mallin erilaisia suorituskykymittareita ja vertasi niitä kilpailevien chatbottien vastaaviin tehdäkseen tämän johtopäätöksen. Nyt Claude 3:n ylivalta heijastuu myös Arenan tulostaulukkoon.

Claude 3 Opus voittaa GPT-4:n noustaen ykköseksi

Claude 3 Opus on noussut LYMSYS Chatbot Arena -listan kärkeen ja nostanut GPT-4-mallin toiselle sijalle. Claude 3 Opus sai Elo-pisteet 1253, mikä on hieman enemmän kuin 1251 GPT-4:stä. Se on sama pistemäärä, joka arvioi, kuinka taitavia shakinpelaajat ovat. Mutta tässä tapauksessa vertailupisteet arvioivat erilaisia tekoälymalleja, eivät shakinpelaajia.

[Areenapäivitys]

70 XNUMX+ uutta Arenan ääntä?? ovat!

Claude-3 Haiku on tehnyt vaikutuksen kaikkiin, jopa saavuttanut GPT-4-tason käyttäjien mieltymyksillämme! Sen nopeus, ominaisuudet ja kontekstin pituus ovat nyt markkinoilla vertaansa vailla?

Onnittelut @AnthropicAI uskomattomassa Claude-3-laukaisussa!

Jännittävämpi… pic.twitter.com/p1Guuf0B3K
— lmsys.org (@lmsysorg) Maaliskuussa 26, 2024

LYMSYS Chatbot Arena ei kuitenkaan ole täydellinen. Sen näyttämät benchmarking-tulokset perustuvat ihmisten äänestämiseen. Pisteet päivitettiin sellaisenaan 70 tuhannen uuden äänen jälkeen. Joten teoriassa paremman tuloksen pitäisi osoittaa, että tekoälymallin kokonaistulos oli parempi. Mutta usein se, kuinka hyvä tulos on, riippuu siitä, kuka sitä katsoo. Käyttäjät valittavat myös, että GPT-4 ei lataudu kunnolla Chatbot Arenassa (via Tomin opas). Siitä huolimatta OpenAI piti ensimmäistä sijaa kaikki nämä vuodet, kunnes Claude 3 Opus syrjäytti sen muutama tunti sitten.

Vaikka päivitetty Arenan sijoitus todennäköisesti lisää kiinnostusta Anthropicin tekoälymalleihin, OpenAI suunnittelee käynnistää GPT-5 tänä kesänä, jonka sanotaan olevan "aineellisesti parempi". Jos näin käy, OpenAI saa todennäköisesti takaisin kärkipaikkansa Arenan tulostaulukossa.

Lisää aiheista: Antropinen, Claude 3 Opus, GPT-4

Rahul

Tekninen toimittaja

Rahul on teknologiatoimittaja, jolla on vuosien kokemus ohjelmistojen kattamisesta, pääasiassa Windowsista ja Androidista. Hän myös rakastaa jakaa mielipiteitään erilaisista teknisistä aiheista.