Song Tử chạm mức thấp mới; không thể phân biệt được giữa một pound và một kg!
3 phút đọc
Cập nhật vào
Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm
Hãy nhớ khi chúng ta còn nhỏ, cha mẹ hoặc giáo viên thường đánh lừa chúng ta bằng cách hỏi – cái nào nặng hơn, một kg lông vũ hay một kg thép, hay thứ gì tương tự? Hãy Trung thực; hầu hết chúng ta đều bị lừa khi điều đó xảy ra lần đầu tiên, và rõ ràng, Gemini của Google cũng vậy. Hơn nữa, Song Tử chưa từng nhìn chung khởi đầu tuyệt vời, Nhưng Google dường như đang làm việc trên nó.
Như được thấy trên Reddit, khi một người dùng hỏi Gemini cái nào nặng hơn - một kg lông vũ hay một cân thép? Song Tử trả lời: “Chúng nặng như nhau.” giải thích thêm, “Một kg và một pound là đơn vị trọng lượng và cả hai vật đều có khối lượng như nhau.”
Dành cho những ai chưa biết, Một kilôgam và một pound là những đơn vị khối lượng khác nhau, vì vậy việc so sánh một kilôgam với một pound của một thứ gì đó là vô nghĩa. Kilôgam là đơn vị khối lượng cơ bản trong Hệ thống đơn vị quốc tế (SI) và bảng Anh là đơn vị khối lượng được sử dụng trong hệ thống thông thường của Hoa Kỳ và hệ thống đế quốc của Vương quốc Anh.
Một kilôgam bằng 2.20462 pound. Vì vậy, để trả lời chính xác câu hỏi trong hình, một kg lông vũ bằng 2.20462 pound thép.
Mặt khác, ChatGPT đã trả lời chính xác câu hỏi tương tự đã được hỏi.
Có nhiều phản hồi trái chiều về hiệu suất của Gemini Ultra, vốn là đặc điểm điển hình của các mô hình ngôn ngữ mới được phát hành. Một số người dùng nhận thấy Ultra giống với ChatGPT thời kỳ đầu, với những điểm mạnh và điểm yếu, chẳng hạn như sự háo hức và đôi khi mắc lỗi. Những người dùng khác coi GPT-4 đáng tự tin hơn do đăng ký hiện tại của họ.
Bản dùng thử miễn phí kéo dài hai tháng khuyến khích thử nghiệm Ultra bất chấp những hạn chế của nó và sự không nhất quán về mặt logic giữa phiên bản Pro và Ultra làm nổi bật các lỗi tiềm ẩn. Có thể cần thời gian và cập nhật để so sánh công bằng hơn và ổn định hiệu suất.
Và đây là yêu thích của tôi.
Hãy nhớ rằng, việc đánh giá một mô hình ngôn ngữ mới đòi hỏi phải xem xét ưu, nhược điểm, đối tượng mục tiêu và trường hợp sử dụng dự định của nó. Việc lựa chọn giữa các công cụ như Ultra và GPT-4 tùy thuộc vào nhu cầu và sở thích cá nhân của bạn.
Nếu bạn muốn chọn cái nào tốt hơn cho mình, đây là hướng dẫn.
Diễn đàn người dùng
Tin nhắn 0