谷歌的超人人工智慧在閱讀理解測試中擊敗了微軟研究院

閱讀時間圖標 2分鐘讀

日曆圖標發表於 2019 年 9 月 27 日

發表於 2019 年 9 月 27 日

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

In 週三在 OpenReview.net 上發表的一篇論文近日，谷歌AI和芝加哥豐田技術學院宣布，他們的新AIALBERT在多項自然語言閱讀理解測試中名列前茅，在SQuAD 2.0、GLUE和高RACE性能得分中均名列第一。

在通用語言理解評估 (GLUE) 基準測試中，ALBERT 在斯坦福問答數據集基準測試 (SQUAD) 上的得分為 89.4，在英語考試閱讀理解 (RACE) 基準測試中的得分為 92.2%。

對於 SQUAD 2.0，人類的平均表現是 89.452。

SQuAD2.0 將 SQuAD100,000 中的 1.1 個問題與 50,000 多個新的、無法回答的問題相結合，這些問題由眾包工作者以對抗方式編寫，看起來與可回答的問題相似。要在 SQuAD2.0 上做好，系統不僅要盡可能回答問題，還要確定段落不支持答案並棄權回答。

ALBERT “使用參數減少技術來降低內存消耗並提高 BERT 的訓練速度，”

“與原始 BERT 相比，我們提出的方法導致模型的擴展性要好得多。我們還使用了一種自我監督的損失，專注於對句子間的連貫性進行建模，並表明它始終如一地幫助具有多句子輸入的下游任務，”論文中寫道。

頂級人工智能公司一直在爭奪比賽的頭把交椅。 7 月下旬，Facebook AI Research 推出了 RoBERTa，該模型取得了最先進的結果；9 月，Microsoft AI 研究人員推出了多任務深度神經網絡 (MT-DNN)，該模型在XNUMX 個 GLUE 基準測試中的 XNUMX 個。

該技術在閱讀互聯網上的大量文本和提供連貫的答案方面具有明顯的應用，這對搜索引擎來說是一個明顯的好處。

有關主題的更多資訊： ai, 谷歌

蘇魯爾·戴維斯

智慧型手機專家

Surur Davids 是 WMPoweruser（後來成為 MSPoweruser.com）的創始人。他是一位擁有十多年經驗的智慧型手機專家。