谷歌的超人人工智能在阅读理解测试中击败了微软研究院

阅读时间图标 2分钟读

日历图标发表于 2019 年 9 月 27 日

发表于 2019 年 9 月 27 日

读者帮助支持 MSpoweruser。如果您通过我们的链接购买，我们可能会获得佣金。

In 周三在 OpenReview.net 上发表的一篇论文近日，谷歌AI和芝加哥丰田技术学院宣布，他们的新AIALBERT在多项自然语言阅读理解测试中名列前茅，在SQuAD 2.0、GLUE和高RACE性能得分中均名列第一。

在通用语言理解评估 (GLUE) 基准测试中，ALBERT 在斯坦福问答数据集基准测试 (SQUAD) 上的得分为 89.4，在英语考试阅读理解 (RACE) 基准测试中的得分为 92.2%。

对于 SQUAD 2.0，人类的平均表现是 89.452。

SQuAD2.0 将 SQuAD100,000 中的 1.1 个问题与 50,000 多个新的、无法回答的问题相结合，这些问题由众包工作者以对抗方式编写，看起来与可回答的问题相似。要在 SQuAD2.0 上做得好，系统不仅要尽可能回答问题，还要确定段落不支持答案并弃权回答。

ALBERT “使用参数减少技术来降低内存消耗并提高 BERT 的训练速度”，

“与原始 BERT 相比，我们提出的方法导致模型的扩展性更好。我们还使用了一种自我监督的损失，专注于对句子间的连贯性进行建模，并表明它始终如一地帮助具有多句子输入的下游任务，”论文中写道。

顶级人工智能公司一直在争夺比赛的头把交椅。 7 月下旬，Facebook AI Research 推出了 RoBERTa，该模型取得了最先进的结果；9 月，Microsoft AI 研究人员推出了多任务深度神经网络 (MT-DNN)，该模型在XNUMX 个 GLUE 基准测试中的 XNUMX 个。

该技术在阅读互联网上的大量文本和提供连贯的答案方面具有明显的应用，这对搜索引擎来说是一个明显的好处。

有关主题的更多信息： ai, 谷歌

苏鲁尔·戴维斯

智能手机专家

Surur Davids 是 WMPoweruser（后来成为 MSPoweruser.com）的创始人。他是一位拥有十多年经验的智能手机专家。