Сверхчеловеческий искусственный интеллект Google свергает Microsoft Research и более того в тесте на понимание прочитанного
2 минута. читать
Опубликовано
Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее
In статья, опубликованная в среду на OpenReview.net, Google AI и Чикагский технологический институт Toyota объявили, что их новый ИИ, ALBERT, занял первое место в нескольких тестах на понимание прочитанного на естественном языке, заняв первое место в SQuAD 2.0, GLUE и высокий балл производительности RACE.
В тесте General Language Understanding Evaluation (GLUE) ALBERT набирает 89.4 балла, в тесте Stanford Question Answering Dataset (SQUAD) — 92.2, а в тесте ReAding Complaining from English Examinations (RACE) — 89.4%.
Для SQUAD 2.0 средняя производительность человека составляет 89.452.
SQuAD2.0 сочетает в себе 100,000 1.1 вопросов SQuAD50,000 с более чем 2.0 XNUMX новых вопросов без ответов, написанных состязательно краудворкерами, чтобы выглядеть похожими на вопросы, на которые можно ответить. Чтобы преуспеть в SQuADXNUMX, системы должны не только отвечать на вопросы, когда это возможно, но также определять, когда ответ не поддерживается абзацем, и воздерживаться от ответа.
ALBERT «использует методы уменьшения параметров, чтобы снизить потребление памяти и увеличить скорость обучения BERT».
«Предлагаемые нами методы позволяют создавать модели, которые масштабируются намного лучше, чем исходный BERT. Мы также используем самоконтролируемую потерю, которая фокусируется на моделировании согласованности между предложениями и показывает, что она последовательно помогает последующим задачам с входными данными из нескольких предложений», — говорится в документе.
Ведущие компании, занимающиеся искусственным интеллектом, борются за первое место в конкурсе. В конце июля Facebook AI Research представила RoBERTa, модель, которая дала самые современные результаты, а в мае исследователи Microsoft AI представили многозадачную глубокую нейронную сеть (MT-DNN), модель, получившую высшие оценки в 7 из 9 тестов GLUE.
Эта технология имеет очевидное применение для чтения объемного текста в Интернете и предоставления связных ответов, что является очевидным преимуществом для поисковых систем.
С помощью VentureBeat