必应宣布图像搜索方面基于人工智能的新改进
2分钟读
发表于
阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多
微软的 Bing 搜索引擎已宣布对其 Bing 搜索引擎进行新的基于 AI 的改进,尤其是图像搜索部分。 这些改进实现了多粒度匹配,提高了对用户查询、图像和网页的理解,以及它们之间的关系。
有点像谷歌,微软现在整合了 BERT/Transformer 技术,利用 1) 预先训练的知识来更好地解释文本信息——尤其是对于上述困难案例; 2)注意力机制将图像和网页嵌入相互感知,使嵌入的文档很好地概括了图像的显着区域和网页上的关键点。
Microsoft 还从查询和候选文档中提取一组选定的对象属性,并使用这些属性进行匹配。
这允许 Microsoft 将查询 {老人游泳图片} 与来自图像内容及其周围文本的相似属性进行匹配。 现在查询和文档可以被认为是“精确匹配”,因为它们共享相同的属性。 这对于更精确的搜索很有用,用户正在搜索具有多个特定特征的项目,例如 {blonde man with a mustache}、{dance suits for Girls with a rose})
Microsoft 还自动为文档(包括图像)生成元数据,然后更容易与搜索匹配。 最有用的元数据类型之一称为“BRQ”——最佳代表查询。 BRQ 通常是对网页主要主题和主要图像内容的良好总结。 为 Bing 图像生成 BRQ 的过程也很大程度上依赖于许多现代深度学习技术。
微软表示,这些技术对其搜索引擎的实用性和准确性产生了真正的影响,Bing 多年来对查询 {Chevy impala 96 的汽车座椅} 的响应就说明了这一点。
微软表示,Bing Image Search 现在可以对用户查询提供更深入的语义理解。 深度学习爱好者可以阅读所有细节 在微软这里。
用户论坛
0消息