Gemini Ultra vs GPT 4: Cách Google Gemini đánh bại OpenAI GPT-4 ở hầu hết các điểm chuẩn

Trang chủ » Tin Tức

Biểu tượng thời gian đọc 2 phút đọc

Biểu tượng lịch Cập nhật vào Tháng Chín 25, 2024

by Devesh Beri

cập nhật trên Tháng Chín 25, 2024

Chia sẻ bài báo này

Cải thiện hướng dẫn này

Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi.

Mô hình ngôn ngữ mới của Google, GeminiMô hình hàng đầu của Gemini Ultra đã vượt trội hơn GPT-4 của OpenAI trong các bài kiểm tra điểm chuẩn toàn diện. Từ các nhiệm vụ dựa trên văn bản đến khả năng hiểu đa phương tiện phức tạp, Gemini luôn thể hiện hiệu suất vượt trội.

Hiệu suất dựa trên văn bản:

Lập luận nhiều bước (Big-Bench Hard): Gemini Ultra đã vượt qua GPT-4, thể hiện khả năng làm theo các hướng dẫn phức tạp và giải quyết các vấn đề gồm nhiều bước.
Đọc hiểu (DROP): Gemini xuất sắc trong việc hiểu các sắc thái của văn bản, vượt GPT-4 trong việc trích xuất thông tin chính xác và trả lời các câu hỏi dựa trên các đoạn đọc.
Lý luận thông thường cho các công việc hàng ngày (HellaSwag): Trong khi GPT-4 vượt trội hơn Gemini ở hạng mục này, cả hai mô hình đều thể hiện khả năng vượt trội trong việc áp dụng kiến thức thông thường vào các tình huống hàng ngày.

Xử lý đa phương tiện:

Nhiệm vụ liên quan đến hình ảnh: Gemini đã vượt qua tất cả các bài kiểm tra liên quan đến xử lý hình ảnh, thể hiện khả năng vượt trội về lý luận cấp đại học, hiểu hình ảnh tự nhiên, OCR, hiểu tài liệu, phân tích đồ họa thông tin và lý luận toán học trong bối cảnh trực quan.
Xử lý video: Gemini đã chiến thắng trong hai bài kiểm tra liên quan đến video, xuất sắc ở phần ghi chú thích tiếng Anh và trả lời câu hỏi qua video.
Xử lý âm thanh: Gemini đã vượt qua các bài kiểm tra âm thanh, chứng tỏ hiệu suất nhận dạng và dịch giọng nói tự động vượt trội.

Nhìn chung, Gemini vượt trội hơn GPT4 ngoại trừ cách suy luận thông thường cho các công việc hàng ngày (HellaSwag).

Bức tranh rất rõ ràng: Gemini Ultra của Google đã tự khẳng định mình là mô hình ngôn ngữ lớn hàng đầu, vượt trội so với đối thủ cạnh tranh, GPT-4, trong nhiều nhiệm vụ khác nhau.

Thêm thông tin vào đây.

Devesh Beri

Nhà báo công nghệ

Đây là những điều thúc đẩy tôi - tạo ra nội dung giàu thông tin và hữu ích, theo đuổi niềm đam mê đua xe thể thao và âm nhạc, tham gia các cuộc thám hiểm, duy trì lối sống lành mạnh và dành thời gian với chú mèo Taco đáng yêu của tôi.

Diễn đàn người dùng

Tin nhắn 0

Sắp xếp theo:

Bình luận Hủy bỏ trả lời