Claude 3 Opus GPT-4 OpenAI را در رتبه بندی مهم چت بات شکست می دهد

نماد زمان خواندن 2 دقیقه خواندن


خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم. نماد راهنمای ابزار

صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب

یادداشت های کلیدی

  • Claude 3 Opus GPT-4 OpenAI را شکست داده و رتبه یک را در رتبه بندی Arena کسب کرده است.
  • Claude 3 Opus دارای امتیاز الو 1253 است که کمی بیشتر از GPT-4 است.
  • نتایج بر اساس میزان رضایت کاربران از خروجی های چندین مدل هوش مصنوعی است.

آنتروپیک خانواده مدل کلود 3 را معرفی کرد اوایل این ماه، ادعا کرد که می تواند از GPT-4 OpenAI پیشی بگیرد. این شرکت معیارهای مختلف عملکرد مدل را نشان داد و آنها را با چت ربات های رقیب مقایسه کرد تا به این نتیجه برسد. اکنون، برتری کلود 3 در جدول امتیازات Arena نیز منعکس می شود.

Claude 3 Opus GPT-4 را شکست داد و شماره یک شد

Claude 3 Opus در رتبه بندی LYMSYS Chatbot Arena در صدر قرار گرفته است تا مدل GPT-4 را به جایگاه دوم برساند. Claude 3 Opus امتیاز Elo 1253 را به دست آورد که کمی بیشتر از 1251 GPT-4 است. این همان امتیازی است که میزان مهارت شطرنج بازان را قضاوت می کند. اما در این مورد، امتیازات معیار مدل‌های مختلف هوش مصنوعی را قضاوت می‌کنند، نه شطرنج‌بازان.

با این حال، LYMSYS Chatbot Arena کامل نیست. نتایج محک زنی که نشان می دهد بر اساس رای مردم است. به این ترتیب، نمرات پس از 70 هزار رای جدید به روز شد. بنابراین، در تئوری، نمره بهتر باید نشان دهد که خروجی کلی مدل هوش مصنوعی بهتر بوده است. اما در بسیاری از مواقع، میزان خوب بودن خروجی بستگی به این دارد که چه کسی آن را مشاهده می کند. کاربران همچنین شکایت دارند که GPT-4 به درستی در Chatbot Arena بارگیری نمی شود (از طریق راهنمای تام). با وجود آن، OpenAI در تمام این سال‌ها جایگاه اول را داشت تا اینکه چند ساعت پیش توسط کلود 3 اوپوس کنار گذاشته شد.

در حالی که رتبه‌بندی به‌روزرسانی‌شده Arena احتمالاً علاقه بیشتری به مدل‌های هوش مصنوعی Anthropic ایجاد می‌کند، OpenAI قصد دارد تا GPT-5 را در تابستان امسال راه اندازی کنید، که گفته می شود "از نظر مادی بهتر است". اگر اینطور باشد، OpenAI احتمالاً جایگاه برتر خود را در جدول امتیازات Arena به دست خواهد آورد.

بیشتر در مورد موضوعات: آنتروپیک, کلود 3 اپوس, GPT-4

پاسخ دهید

آدرس ایمیل شما منتشر نخواهد شد. بخشهای موردنیاز علامتگذاری شدهاند *