Gemini Ultra vs GPT 4: Cách Google Gemini đánh bại OpenAI GPT-4 ở hầu hết các điểm chuẩn

Biểu tượng thời gian đọc 2 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Mô hình ngôn ngữ mới của Google, GeminiMô hình hàng đầu của Gemini Ultra đã vượt trội hơn GPT-4 của OpenAI trong các bài kiểm tra điểm chuẩn toàn diện. Từ các nhiệm vụ dựa trên văn bản đến khả năng hiểu đa phương tiện phức tạp, Gemini luôn thể hiện hiệu suất vượt trội.

Hiệu suất dựa trên văn bản:

  • Lập luận nhiều bước (Big-Bench Hard): Gemini Ultra đã vượt qua GPT-4, thể hiện khả năng làm theo các hướng dẫn phức tạp và giải quyết các vấn đề gồm nhiều bước.
  • Đọc hiểu (DROP): Gemini xuất sắc trong việc hiểu các sắc thái của văn bản, vượt GPT-4 trong việc trích xuất thông tin chính xác và trả lời các câu hỏi dựa trên các đoạn đọc.
  • Lý luận thông thường cho các công việc hàng ngày (HellaSwag): Trong khi GPT-4 vượt trội hơn Gemini ở hạng mục này, cả hai mô hình đều thể hiện khả năng vượt trội trong việc áp dụng kiến ​​thức thông thường vào các tình huống hàng ngày.

Xử lý đa phương tiện:

  • Nhiệm vụ liên quan đến hình ảnh: Gemini đã vượt qua tất cả các bài kiểm tra liên quan đến xử lý hình ảnh, thể hiện khả năng vượt trội về lý luận cấp đại học, hiểu hình ảnh tự nhiên, OCR, hiểu tài liệu, phân tích đồ họa thông tin và lý luận toán học trong bối cảnh trực quan.
  • Xử lý video: Gemini đã chiến thắng trong hai bài kiểm tra liên quan đến video, xuất sắc ở phần ghi chú thích tiếng Anh và trả lời câu hỏi qua video.
  • Xử lý âm thanh: Gemini đã vượt qua các bài kiểm tra âm thanh, chứng tỏ hiệu suất nhận dạng và dịch giọng nói tự động vượt trội.

Nhìn chung, Gemini vượt trội hơn GPT4 ngoại trừ cách suy luận thông thường cho các công việc hàng ngày (HellaSwag).

Bức tranh rất rõ ràng: Gemini Ultra của Google đã tự khẳng định mình là mô hình ngôn ngữ lớn hàng đầu, vượt trội so với đối thủ cạnh tranh, GPT-4, trong nhiều nhiệm vụ khác nhau. 

Thêm thông tin vào đây.

Diễn đàn người dùng

Tin nhắn 0