微软基于人工智能的视频元数据提取服务现已全面推出
1分钟读
发表于
读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。
阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多
Microsoft Video Indexer 是一项云服务,可让您从视频中提取视觉和语音元数据,这些元数据可用于在现有应用中构建增强的搜索体验。 在去年的 Build 开发者大会上,微软首次公布了 Video Indexer 服务的公开预览版。 在上周的 IBC 2018 上,微软宣布了 Video Indexer 服务的全面可用性。 除了有关 GA 的信息,Microsoft 还宣布了以下新功能。
- 情感识别 基于语音内容和语音音调检测视频和音频资产中的情感时刻的模型。
- A 主题推理 基于口语和视觉提示理解视频或音频文件的高级主题而构建的模型。 此模型中的主题来自 IPTC 分类等,以符合行业标准。
- 增强 名人识别模型 根据常用的数据源(如 IMDB、维基百科和领英顶级影响者),它现在覆盖了 XNUMX 万张面孔。
了解有关此公告的更多信息 此处.