Claude 3 Opus schlägt GPT-4 von OpenAI im wichtigen Chatbot-Ranking

Symbol für die Lesezeit 2 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Lesen Sie weiter

Wichtige Hinweise

  • Claude 3 Opus hat OpenAIs GPT-4 geschlagen und ist die Nummer eins im Arena-Ranking.
  • Claude 3 Opus hat einen Elo-Score von 1253, etwas mehr als GPT-4.
  • Die Ergebnisse basieren darauf, wie zufrieden Benutzer mit den Ergebnissen mehrerer KI-Modelle waren.

Anthropisch kündigte die Modellfamilie Claude 3 an Anfang dieses Monats behauptete es, es könne OpenAIs GPT-4 übertreffen. Das Unternehmen zeigte verschiedene Leistungsmetriken des Modells und verglich sie mit denen konkurrierender Chatbots, um zu dieser Schlussfolgerung zu gelangen. Jetzt spiegelt sich die Vormachtstellung von Claude 3 auch in der Arena-Rangliste wider.

Claude 3 Opus schlägt GPT-4 und wird die Nummer eins

Claude 3 Opus hat die LYMSYS Chatbot Arena-Rangliste angeführt und das GPT-4-Modell auf den zweiten Platz verdrängt. Das Claude 3 Opus erreichte einen Elo-Wert von 1253, etwas mehr als 1251 von GPT-4. Es ist die gleiche Punktzahl, die beurteilt, wie geschickt Schachspieler sind. Aber in diesem Fall beurteilen die Benchmark-Ergebnisse verschiedene KI-Modelle und nicht Schachspieler.

Allerdings ist die LYMSYS Chatbot Arena nicht perfekt. Die angezeigten Benchmarking-Ergebnisse basieren auf der Abstimmung der Menschen. Daher wurden die Ergebnisse nach 70 neuen Stimmen aktualisiert. Theoretisch sollte ein besserer Wert also bedeuten, dass die Gesamtleistung des KI-Modells besser war. Aber wie gut die Ausgabe ist, hängt oft davon ab, wer sie ansieht. Benutzer beschweren sich auch darüber, dass GPT-4 in Chatbot Arena nicht richtig geladen wird (via Tom'sguide). Trotzdem hielt OpenAI all die Jahre den ersten Platz, bis es vor ein paar Stunden von Claude 3 Opus verdrängt wurde.

Während ein aktualisiertes Arena-Ranking wahrscheinlich mehr Interesse an den KI-Modellen von Anthropic wecken wird, hat OpenAI Pläne, dies zu tun starten Sie GPT-5 diesen Sommer, was angeblich „materiell besser“ sei. Sollte dies der Fall sein, wird OpenAI wahrscheinlich seinen Spitzenplatz auf der Arena-Rangliste zurückerobern.

Mehr zu den Themen: Anthropisch, Claude 3 Opus, GPT-4

Hinterlassen Sie uns einen Kommentar

E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind MIT * gekennzeichnet. *