Windows 10 的「講述人」利用人工智慧自動編寫照片標題

閱讀時間圖標 1分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

講述人是 Windows 中的一種工具,可以大聲朗讀 PC 屏幕上的文本並描述事件,例如通知或日曆約會,因此您可以在沒有顯示器的情況下使用 PC。 視障人士使用此功能與他們的 PC 進行交互。 當您打開照片時,“講述人”將閱讀該照片可用的替代文本。 如您所知,大多數照片不包含替代文字,這使得視障人士難以閱讀照片。 微軟現在正試圖使用人工智能來解決這個問題。

昨天,微軟向 Windows Insider 發布了適用於 PC 的 Windows 10 Build 16226。此版本包括更新的講述人,具有自動字幕功能。講述人將使用人工智慧生成不包含替代文字的圖像描述。現在它還可以使用光學字元辨識從圖像中提取文字。此功能將改變視障人士在電腦上使用照片的方式。

要嘗試此功能,請打開講述人,將焦點設置為圖像,然後按 Capslock + Shift + D 以聽取其說明。 由於它使用 Microsoft 的認知服務 API,因此您需要連接到 Internet 才能工作。

有關主題的更多資訊: 自動字幕, 四通八達的交通網絡, 旁白, 10窗口, 構建Windows 10的16226, 視窗10創秋季更新, Windows 10 電腦, 窗戶內幕