A Claude 3 Opus megelőzi az OpenAI GPT-4-ét a fontos chatbot-rangsorban

Kezdőlap » Hírek

Olvasási idő ikonra 2 perc olvas

Naptár ikonra Publikálva Március 28, 2024

by Rahul

közzétették Március 28, 2024

Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol.

Főbb megjegyzések

A Claude 3 Opus legyőzte az OpenAI GPT-4-ét, és ezzel az első helyre került az Arena rangsorban.
A Claude 3 Opus Elo pontszáma 1253, valamivel több, mint a GPT-4.
Az eredmények azon alapulnak, hogy a felhasználók mennyire voltak elégedettek számos AI-modell kimenetével.

Antropikus bejelentette a Claude 3 modellcsaládot a hónap elején, azt állítva, hogy felülmúlhatja az OpenAI GPT-4-ét. A vállalat különböző teljesítménymutatókat mutatott be a modellről, és összehasonlította azokat a rivális chatbotokkal, hogy levonja ezt a következtetést. A Claude 3 fölény most az Arena ranglistáján is tükröződik.

A Claude 3 Opus legyőzi a GPT-4-et, és az első helyre került

A Claude 3 Opus a LYMSYS Chatbot Arena ranglistájának élére került, ezzel a GPT-4 modellt a második helyre szorította. A Claude 3 Opus 1253 Elo pontszámot ért el, ami valamivel több, mint 1251 a GPT-4-ből. Ugyanez a pontszám ítéli meg a sakkozók ügyességét. De ebben az esetben a benchmark pontszámok különböző AI-modelleket ítélnek meg, nem sakkozókat.

[Aréna frissítés]

70 ezer+ új Aréna szavazat?? benne van!

A Claude-3 Haiku mindenkit lenyűgözött, még a GPT-4 szintet is elérte felhasználói preferenciáink alapján! A sebesség, a képességek és a kontextus hossza páratlan a piacon?

gratula @AnthropicAI a hihetetlen Claude-3 kilövésen!

Izgalmasabb… pic.twitter.com/p1Guuf0B3K
— lmsys.org (@lmsysorg) Március 26, 2024

A LYMSYS Chatbot Arena azonban nem tökéletes. Az általa mutatott benchmarking eredmények az emberek szavazásán alapulnak. Így a pontszámok 70 ezer új szavazat után frissültek. Tehát elméletileg a jobb pontszám azt jelzi, hogy az AI-modell általános teljesítménye jobb volt. De sok esetben az, hogy mennyire jó a kimenet, attól függ, hogy ki nézi. A felhasználók arra is panaszkodnak, hogy a GPT-4 nem töltődik be megfelelően a Chatbot Arénában (via Tom útmutatója). Ennek ellenére az OpenAI tartotta az első pozíciót az elmúlt években, mígnem néhány órával ezelőtt a Claude 3 Opus kiszorította.

Míg az Arena frissített rangsora valószínűleg nagyobb érdeklődést vált ki az Anthropic mesterséges intelligencia modelljei iránt, az OpenAI azt tervezi, hogy ezen a nyáron elindítja a GPT-5-öt, amiről azt mondják, hogy „anyagilag jobb”. Ha ez a helyzet, az OpenAI valószínűleg visszaszerzi vezető helyét az Aréna ranglistáján.

Bővebben a témákról: Antropikus, Claude 3 Opus, GPT-4

Rahul

Műszaki újságíró

Rahul technológiai újságíró, sok éves tapasztalattal rendelkezik a szoftverek, elsősorban a Windows és az Android területén. Szívesen megosztja véleményét különféle technológiai témákban.

A Claude 3 Opus legyőzi a GPT-4-et, és az első helyre került

Hagy egy Válaszol