Nghiên cứu của Microsoft vượt qua hiệu suất ở cấp độ con người trên tập dữ liệu phân loại ImageNet

Biểu tượng thời gian đọc 1 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Microsoft Research

Microsoft Research gần đây đã xuất bản một bài báo học thuật có tiêu đề “Tìm hiểu sâu về bộ chỉnh lưu: Vượt qua hiệu suất ở cấp độ con người trên phân loại ImageNet”. Trong bài báo này, họ đang đề xuất một mô hình chỉnh lưu mới vượt qua hiệu suất ở cấp độ con người trong thử thách nhận dạng thị giác.

Các đơn vị kích hoạt được chỉnh lưu (bộ chỉnh lưu) rất cần thiết cho các mạng nơ-ron hiện đại. Trong công trình này, chúng tôi nghiên cứu mạng nơron chỉnh lưu để phân loại ảnh từ hai khía cạnh. Đầu tiên, chúng tôi đề xuất Đơn vị tuyến tính chỉnh lưu tham số (PReLU) tổng quát hóa đơn vị chỉnh lưu truyền thống. PReLU cải thiện khả năng phù hợp mô hình với chi phí tính toán bổ sung gần như bằng không và ít rủi ro trang bị quá mức. Thứ hai, chúng tôi thu được một phương pháp khởi tạo mạnh mẽ đặc biệt xem xét các phi tuyến của bộ chỉnh lưu. Phương pháp này cho phép chúng tôi đào tạo các mô hình được hiệu chỉnh cực kỳ sâu trực tiếp từ đầu và điều tra các kiến ​​trúc mạng sâu hơn hoặc rộng hơn. Dựa trên mạng PReLU của chúng tôi (PReLU-nets), chúng tôi đạt được 4.94% lỗi kiểm tra top 5 trên tập dữ liệu phân loại ImageNet 2012. Đây là mức cải thiện tương đối 26% so với người chiến thắng ILSVRC 2014 (GoogLeNet, 6.66%). Theo hiểu biết của chúng tôi, kết quả của chúng tôi là kết quả đầu tiên vượt qua hiệu suất ở cấp độ con người (5.1%, Russakovsky và cộng sự) trong thử thách nhận dạng hình ảnh này.

Tải xuống toàn bộ bài báo từ liên kết bên dưới.

nguồn: Đại học Cornell

Thông tin thêm về các chủ đề: phân loại, GoogleLeNet, Nhận dạng hình ảnh, IMAGEnet, microsoft, Mạng lưới thần kinh, Sửa chữa