Windows 10 的“讲述人”利用人工智能自动编写照片标题

阅读时间图标 1分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

讲述人是 Windows 中的一种工具,可以大声朗读 PC 屏幕上的文本并描述事件,例如通知或日历约会,因此您可以在没有显示器的情况下使用 PC。 视障人士使用此功能与他们的 PC 进行交互。 当您打开照片时,“讲述人”将阅读该照片可用的替代文本。 如您所知,大多数照片不包含替代文字,这使得视障人士难以阅读照片。 微软现在正试图使用​​人工智能来解决这个问题。

昨天,微软向 Windows Insider 发布了适用于 PC 的 Windows 10 Build 16226。此版本包括更新的讲述人,具有自动字幕功能。讲述人将使用人工智能生成不包含替代文本的图像描述。现在它还可以使用光学字符识别从图像中提取文本。此功能将改变视障人士在电脑上使用照片的方式。

要尝试此功能,请打开讲述人,将焦点设置为图像,然后按 Capslock + Shift + D 以听取其说明。 由于它使用 Microsoft 的认知服务 API,因此您需要连接到 Internet 才能工作。

有关主题的更多信息: 自动字幕, 四通八达的交通网络, 旁白, 10窗口, 构建Windows 10的16226, 视窗10创秋季更新, Windows 10电脑, 窗户内幕