微軟研究院正在開發一個人工智能,它可以講述你的假期快照的故事

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

去海灘旅行

可以描述圖片的人工智能已經在互聯網上發揮作用,例如為 Facebook 上的圖片添加標題。 現在微軟研究院正在將這項技術提升到一個新的水平,要求他們的人工智能講述一系列圖片的故事。

例如,一個圖像字幕程序可能會拍攝五張圖像,然後說:“這是一張家庭照片; 這是一張蛋糕的照片; 這是一張狗的照片; 這是一張海灘的照片,”講故事的程序可能會拍攝同樣的照片並說,“一家人聚在一起野餐; 他們有很多美味的食物; 狗很高興在那裡; 他們在沙灘上玩得很開心; 他們甚至在水里游泳。”

米切爾說,未來,計算機化的講故事可以幫助人們自動為他們上傳到社交媒體的圖像幻燈片生成故事。 “你可以幫助人們分享他們的經驗,同時減少一些人認為相當乏味的瑣碎工作,”她說。 計算機化的講故事“還可以幫助視力受損的人為看不見的人打開圖像。”

該研究的資深作者、計算機科學家瑪格麗特·米切爾 (Margaret Mitchell) 說:“我們的目標是幫助 AI 提供更多類似人類的智能,幫助它在更抽象的層面上理解事物——有趣、令人毛骨悚然、怪異或有趣意味著什麼。”微軟研究院。 “人們世代相傳的故事,用它們來傳達我們的道德、戰略和智慧。 我們專注於講故事,我們希望幫助 AI 以一種對人類非常安全和有益的方式理解人類的概念,而不是教它如何打敗人類。”

如果人工智能學會了根據圖像序列講故事,“這就是為視頻做同樣事情的墊腳石,”米切爾說。 “這可能有助於提供有趣的應用程序。 例如,對於安全攝像頭,您可能只需要任何值得注意的摘要,或者您可以自動直播推特事件,”她說。

研究人員將於本月晚些時候在聖地亞哥舉行的計算語言學協會北美分會年會上展示他們的發現。

有關主題的更多資訊: ai, 微軟研究