Claude 3 Opus GPT-4 OpenAI را در رتبه بندی مهم چت بات شکست می دهد
2 دقیقه خواندن
منتشر شده در
صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب
یادداشت های کلیدی
- Claude 3 Opus GPT-4 OpenAI را شکست داده و رتبه یک را در رتبه بندی Arena کسب کرده است.
- Claude 3 Opus دارای امتیاز الو 1253 است که کمی بیشتر از GPT-4 است.
- نتایج بر اساس میزان رضایت کاربران از خروجی های چندین مدل هوش مصنوعی است.
آنتروپیک خانواده مدل کلود 3 را معرفی کرد اوایل این ماه، ادعا کرد که می تواند از GPT-4 OpenAI پیشی بگیرد. این شرکت معیارهای مختلف عملکرد مدل را نشان داد و آنها را با چت ربات های رقیب مقایسه کرد تا به این نتیجه برسد. اکنون، برتری کلود 3 در جدول امتیازات Arena نیز منعکس می شود.
Claude 3 Opus GPT-4 را شکست داد و شماره یک شد
Claude 3 Opus در رتبه بندی LYMSYS Chatbot Arena در صدر قرار گرفته است تا مدل GPT-4 را به جایگاه دوم برساند. Claude 3 Opus امتیاز Elo 1253 را به دست آورد که کمی بیشتر از 1251 GPT-4 است. این همان امتیازی است که میزان مهارت شطرنج بازان را قضاوت می کند. اما در این مورد، امتیازات معیار مدلهای مختلف هوش مصنوعی را قضاوت میکنند، نه شطرنجبازان.
با این حال، LYMSYS Chatbot Arena کامل نیست. نتایج محک زنی که نشان می دهد بر اساس رای مردم است. به این ترتیب، نمرات پس از 70 هزار رای جدید به روز شد. بنابراین، در تئوری، نمره بهتر باید نشان دهد که خروجی کلی مدل هوش مصنوعی بهتر بوده است. اما در بسیاری از مواقع، میزان خوب بودن خروجی بستگی به این دارد که چه کسی آن را مشاهده می کند. کاربران همچنین شکایت دارند که GPT-4 به درستی در Chatbot Arena بارگیری نمی شود (از طریق راهنمای تام). با وجود آن، OpenAI در تمام این سالها جایگاه اول را داشت تا اینکه چند ساعت پیش توسط کلود 3 اوپوس کنار گذاشته شد.
در حالی که رتبهبندی بهروزرسانیشده Arena احتمالاً علاقه بیشتری به مدلهای هوش مصنوعی Anthropic ایجاد میکند، OpenAI قصد دارد تا GPT-5 را در تابستان امسال راه اندازی کنید، که گفته می شود "از نظر مادی بهتر است". اگر اینطور باشد، OpenAI احتمالاً جایگاه برتر خود را در جدول امتیازات Arena به دست خواهد آورد.