AI siêu phàm của Google soán ngôi Microsoft Research trong bài kiểm tra đọc hiểu

Biểu tượng thời gian đọc 2 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

In một bài báo được xuất bản hôm thứ Tư trên OpenReview.net, Google AI và Toyota Technological Institute of Chicago đã thông báo rằng AI mới của họ, ALBERT, đã giành vị trí hàng đầu trong một số bài kiểm tra khả năng đọc hiểu ngôn ngữ tự nhiên, giành vị trí đầu tiên trong SQuAD 2.0, GLUE và điểm hiệu suất RACE cao.

Trên điểm chuẩn Đánh giá Hiểu biết Ngôn ngữ Chung (GLUE), ALBERT đạt được số điểm 89.4, trên điểm chuẩn Tập dữ liệu Trả lời Câu hỏi Stanford (SQUAD), 92.2 và trên điểm chuẩn Đánh giá lại Hiểu biết từ Kỳ thi Tiếng Anh (RACE), 89.4%.

Đối với SQUAD 2.0, hiệu suất trung bình của con người là 89.452.

SQuAD2.0 kết hợp 100,000 câu hỏi trong SQuAD1.1 với hơn 50,000 câu hỏi mới, không thể trả lời được những người làm việc trong cộng đồng viết theo cách đối nghịch nhau để trông giống với những câu hỏi có thể trả lời được. Để làm tốt SQuAD2.0, hệ thống không chỉ phải trả lời câu hỏi khi có thể, mà còn phải xác định khi đoạn văn không hỗ trợ câu trả lời nào và kiêng trả lời.

ALBERT “sử dụng các kỹ thuật giảm tham số để giảm mức tiêu thụ bộ nhớ và tăng tốc độ đào tạo của BERT,”

“Các phương pháp đề xuất của chúng tôi dẫn đến các mô hình có quy mô tốt hơn nhiều so với BERT ban đầu. Chúng tôi cũng sử dụng sự mất mát do tự giám sát tập trung vào việc mô hình hóa sự mạch lạc giữa các câu và cho thấy nó giúp các nhiệm vụ xuôi dòng một cách nhất quán với các đầu vào gồm nhiều câu, ”bài báo viết.

Các công ty AI hàng đầu đã cạnh tranh cho vị trí hàng đầu trong một cuộc thi. Vào cuối tháng 7, Facebook AI Research đã giới thiệu RoBERTa, một mô hình đã đạt được kết quả hiện đại và vào tháng 9, các nhà nghiên cứu AI của Microsoft đã giới thiệu Mạng thần kinh sâu đa tác vụ (MT-DNN), một mô hình đã đạt được điểm cao nhất trong XNUMX trong số XNUMX điểm chuẩn KEO.

Công nghệ này có các ứng dụng rõ ràng để đọc một lượng lớn văn bản trên internet và cung cấp các câu trả lời mạch lạc, một lợi ích rõ ràng cho các công cụ tìm kiếm.

Thông qua VentureBeat

Thông tin thêm về các chủ đề: ai, google