Gemini Ultra กับ GPT 4: Google Gemini เอาชนะ OpenAI GPT-4 ในการวัดประสิทธิภาพส่วนใหญ่ได้อย่างไร

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน


ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา ไอคอนคำแนะนำเครื่องมือ

อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม

โมเดลภาษาใหม่ของ Google GeminiGemini Ultra รุ่นท็อปของ OpenAI มีประสิทธิภาพเหนือกว่า GPT-4 ของ OpenAI ในการทดสอบเกณฑ์มาตรฐานที่ครอบคลุม จากงานที่เป็นข้อความไปจนถึงการทำความเข้าใจมัลติมีเดียที่ซับซ้อน Gemini แสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าอย่างต่อเนื่อง

ประสิทธิภาพตามข้อความ:

  • การใช้เหตุผลหลายขั้นตอน (Big-Bench Hard): Gemini Ultra เหนือกว่า GPT-4 โดยแสดงให้เห็นความสามารถในการปฏิบัติตามคำสั่งที่ซับซ้อนและแก้ไขปัญหาหลายขั้นตอน
  • การอ่านเพื่อความเข้าใจ (DROP): ราศีเมถุนเก่งในการทำความเข้าใจความแตกต่างของข้อความ โดยเกินกว่า GPT-4 ในการดึงข้อมูลและตอบคำถามจากการอ่านข้อความได้อย่างแม่นยำ
  • การใช้เหตุผลสามัญสำนึกสำหรับงานประจำวัน (HellaSwag): แม้ว่า GPT-4 จะเหนือกว่า Gemini ในหมวดหมู่นี้ แต่ทั้งสองรุ่นก็แสดงให้เห็นถึงความสามารถที่โดดเด่นในการนำความรู้สามัญสำนึกมาใช้กับสถานการณ์ในชีวิตประจำวัน

การประมวลผลมัลติมีเดีย:

  • งานที่เกี่ยวข้องกับรูปภาพ: Gemini ผ่านการทดสอบทั้งหมดที่เกี่ยวข้องกับการประมวลผลภาพ ซึ่งแสดงให้เห็นถึงความสามารถที่เหนือกว่าในด้านการให้เหตุผลระดับวิทยาลัย การทำความเข้าใจรูปภาพที่เป็นธรรมชาติ OCR การทำความเข้าใจเอกสาร การวิเคราะห์อินโฟกราฟิก และการให้เหตุผลทางคณิตศาสตร์ในบริบทของภาพ
  • การประมวลผลวิดีโอ: ราศีเมถุนได้รับชัยชนะในการทดสอบที่เกี่ยวข้องกับวิดีโอสองครั้ง โดยมีความเป็นเลิศในการจับภาพคำบรรยายภาษาอังกฤษและการตอบคำถามด้วยวิดีโอ
  • การประมวลผลเสียง: Gemini กวาดการทดสอบเสียง แสดงให้เห็นถึงประสิทธิภาพการแปลและจดจำคำพูดอัตโนมัติที่เหนือกว่า

โดยรวมแล้ว Gemini มีประสิทธิภาพเหนือกว่า GPT4 ยกเว้นในแง่เหตุผลทั่วไปสำหรับงานประจำวัน (HellaSwag)

ภาพนั้นชัดเจน: Gemini Ultra ของ Google ได้สร้างชื่อเสียงให้กับตนเองในฐานะโมเดลภาษาขนาดใหญ่ชั้นนำ ซึ่งเหนือกว่าคู่แข่งอย่าง GPT-4 ในงานต่างๆ 

ข้อมูลเพิ่มเติม Good Farm Animal Welfare Awards.

ฟอรั่มผู้ใช้

ข้อความ 0