Claude 3 Opus GPT-4 OpenAI را در رتبه بندی مهم چت بات شکست می دهد

صفحه اصلی » رسانه

نماد زمان خواندن 2 دقیقه خواندن

نماد تقویم منتشر شده در مارس 28، 2024

by راهول

منتشر شده در مارس 28، 2024

خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم.

یادداشت های کلیدی

Claude 3 Opus GPT-4 OpenAI را شکست داده و رتبه یک را در رتبه بندی Arena کسب کرده است.
Claude 3 Opus دارای امتیاز الو 1253 است که کمی بیشتر از GPT-4 است.
نتایج بر اساس میزان رضایت کاربران از خروجی های چندین مدل هوش مصنوعی است.

آنتروپیک خانواده مدل کلود 3 را معرفی کرد اوایل این ماه، ادعا کرد که می تواند از GPT-4 OpenAI پیشی بگیرد. این شرکت معیارهای مختلف عملکرد مدل را نشان داد و آنها را با چت ربات های رقیب مقایسه کرد تا به این نتیجه برسد. اکنون، برتری کلود 3 در جدول امتیازات Arena نیز منعکس می شود.

Claude 3 Opus GPT-4 را شکست داد و شماره یک شد

Claude 3 Opus در رتبه بندی LYMSYS Chatbot Arena در صدر قرار گرفته است تا مدل GPT-4 را به جایگاه دوم برساند. Claude 3 Opus امتیاز Elo 1253 را به دست آورد که کمی بیشتر از 1251 GPT-4 است. این همان امتیازی است که میزان مهارت شطرنج بازان را قضاوت می کند. اما در این مورد، امتیازات معیار مدل‌های مختلف هوش مصنوعی را قضاوت می‌کنند، نه شطرنج‌بازان.

[به روز رسانی آرنا]

70K+ رای آرنا جدید؟؟ هستند!

هایکو کلود-3 همه را تحت تأثیر قرار داده است، حتی با ترجیح کاربر ما به سطح GPT-4 رسیده است! سرعت، قابلیت ها و طول زمینه آن اکنون در بازار بی نظیر است؟

تبریک میگم @AnthropicAI در پرتاب باورنکردنی کلود-3!

هیجان انگیز تر… pic.twitter.com/p1Guuf0B3K
— lmsys.org (@lmsysorg) مارس 26، 2024

با این حال، LYMSYS Chatbot Arena کامل نیست. نتایج محک زنی که نشان می دهد بر اساس رای مردم است. به این ترتیب، نمرات پس از 70 هزار رای جدید به روز شد. بنابراین، در تئوری، نمره بهتر باید نشان دهد که خروجی کلی مدل هوش مصنوعی بهتر بوده است. اما در بسیاری از مواقع، میزان خوب بودن خروجی بستگی به این دارد که چه کسی آن را مشاهده می کند. کاربران همچنین شکایت دارند که GPT-4 به درستی در Chatbot Arena بارگیری نمی شود (از طریق راهنمای تام). با وجود آن، OpenAI در تمام این سال‌ها جایگاه اول را داشت تا اینکه چند ساعت پیش توسط کلود 3 اوپوس کنار گذاشته شد.

در حالی که رتبه‌بندی به‌روزرسانی‌شده Arena احتمالاً علاقه بیشتری به مدل‌های هوش مصنوعی Anthropic ایجاد می‌کند، OpenAI قصد دارد تا GPT-5 را در تابستان امسال راه اندازی کنید، که گفته می شود "از نظر مادی بهتر است". اگر اینطور باشد، OpenAI احتمالاً جایگاه برتر خود را در جدول امتیازات Arena به دست خواهد آورد.

بیشتر در مورد موضوعات: آنتروپیک, کلود 3 اپوس, GPT-4

راهول

روزنامه نگار فناوری

راهول یک روزنامه‌نگار فناوری است که سال‌ها تجربه در پوشش نرم‌افزاری، عمدتاً ویندوز و اندروید دارد. او همچنین دوست دارد نظرات خود را در مورد موضوعات مختلف فناوری به اشتراک بگذارد.

Claude 3 Opus GPT-4 را شکست داد و شماره یک شد

پاسخ دهید