Claude 3 Opus เอาชนะ GPT-4 ของ OpenAI ในการจัดอันดับแชทบอทที่สำคัญ

หน้าแรก » ข่าว

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน

ไอคอนปฏิทิน เผยแพร่เมื่อ March 28, 2024

by ราหุล

เผยแพร่บน March 28, 2024

ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา

หมายเหตุสำคัญ

Claude 3 Opus เอาชนะ GPT-4 ของ OpenAI เพื่อขึ้นอันดับหนึ่งในการจัดอันดับ Arena
Claude 3 Opus มีคะแนน Elo อยู่ที่ 1253 มากกว่า GPT-4 เล็กน้อย
ผลลัพธ์จะขึ้นอยู่กับความพึงพอใจของผู้ใช้กับผลลัพธ์ของโมเดล AI หลายแบบ

มานุษยวิทยา ประกาศเปิดตัวตระกูลโมเดล Claude 3 เมื่อต้นเดือนที่ผ่านมา โดยอ้างว่าสามารถเอาชนะ GPT-4 ของ OpenAI ได้ บริษัทได้แสดงตัวชี้วัดประสิทธิภาพต่างๆ ของโมเดล และเปรียบเทียบกับแชทบอทของคู่แข่งเพื่อหาข้อสรุปดังกล่าว ตอนนี้ อำนาจสูงสุดของ Claude 3 ยังสะท้อนให้เห็นบนกระดานผู้นำของลานประลองอีกด้วย

Claude 3 Opus แซง GPT-4 ขึ้นอันดับหนึ่ง

Claude 3 Opus ติดอันดับ LYMSYS Chatbot Arena เพื่อผลักดันรุ่น GPT-4 ขึ้นสู่ตำแหน่งที่สอง Claude 3 Opus ได้คะแนน Elo ที่ 1253 มากกว่า GPT-1251 ที่ 4 เล็กน้อย เป็นคะแนนเดียวกับที่ตัดสินว่าผู้เล่นหมากรุกเก่งแค่ไหน แต่ในกรณีนี้ คะแนนมาตรฐานจะตัดสินจากโมเดล AI ต่างๆ ไม่ใช่ผู้เล่นหมากรุก

[อัพเดตอารีน่า]

โหวตอารีน่าใหม่มากกว่า 70 ครั้ง?? อยู่ใน!

Claude-3 Haiku สร้างความประทับใจให้กับทุกคน แม้จะไปถึงระดับ GPT-4 ตามความต้องการของผู้ใช้ก็ตาม! ความเร็ว ความสามารถ และความยาวบริบทของมันไม่มีใครเทียบได้ในตลาดตอนนี้?

ยินดีด้วย @AnthropicAI ในการเปิดตัว Claude-3 อันน่าทึ่ง!

น่าตื่นเต้นยิ่งขึ้น… pic.twitter.com/p1Guuf0B3K
— lmsys.org (@lmsysorg) March 26, 2024

อย่างไรก็ตาม LYMSYS Chatbot Arena ยังไม่สมบูรณ์แบบ ผลลัพธ์การเปรียบเทียบที่แสดงนั้นขึ้นอยู่กับการโหวตของผู้คน ด้วยเหตุนี้ คะแนนจึงได้รับการอัปเดตหลังจากมีผู้โหวตใหม่ถึง 70 คน ตามทฤษฎีแล้ว คะแนนที่ดีกว่าควรบ่งชี้ว่าผลลัพธ์โดยรวมของโมเดล AI นั้นดีกว่า แต่ส่วนใหญ่แล้ว ผลงานจะดีแค่ไหนขึ้นอยู่กับว่าใครกำลังดูอยู่ ผู้ใช้ยังบ่นว่า GPT-4 โหลดไม่ถูกต้องใน Chatbot Arena (ผ่าน ทอมส์ไกด์- อย่างไรก็ตาม OpenAI ก็ยังครองตำแหน่งแรกตลอดหลายปีที่ผ่านมา จนกระทั่งถูกโค่นล้มโดย Claude 3 Opus เมื่อไม่กี่ชั่วโมงที่แล้ว

แม้ว่าการจัดอันดับ Arena ที่อัปเดตจะสร้างความสนใจในโมเดล AI ของ Anthropic มากขึ้น แต่ OpenAI ก็มีแผนที่จะทำ เปิดตัว GPT-5 ในฤดูร้อนนี้ซึ่งได้รับการกล่าวขานว่า "ดีขึ้นทางวัตถุ" หากเป็นเช่นนั้น OpenAI ก็มีแนวโน้มที่จะฟื้นตำแหน่งสูงสุดในกระดานผู้นำของ Arena

ข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อต่างๆ: มานุษยวิทยา, คลอดด์ 3 บทประพันธ์, จีพีที-4

ราหุล

นักข่าวเทคโนโลยี

Rahul เป็นนักข่าวสายเทคโนโลยีที่มีประสบการณ์หลายปีในด้านซอฟต์แวร์ โดยเฉพาะ Windows และ Android เขายังชอบแบ่งปันความคิดเห็นของเธอเกี่ยวกับหัวข้อเทคโนโลยีที่หลากหลาย