微軟研究院的新技術可以偵測你周圍的事物,並回答有關它們的問題
1分鐘讀
發表於
讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。
請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多
微軟研究人員一直在研究令人著迷的新技術。 今天,該公司發布了一篇博客文章,其中公司對公司的新系統進行了介紹,該系統可以像人類一樣分析圖像並回答問題。 微軟的一組研究人員與卡內基梅隆大學合作構建了這個新系統,該系統使用計算機視覺、深度學習和語言理解來分析圖像。
以下是該技術如何工作的一些示例:
該系統顯然就像一組人眼一樣工作。 該系統使用深度學習“提取視覺信息,用自然語言表示問題的含義,並通過兩個獨立的步驟將注意力集中在圖像的較窄區域上,以尋求準確的答案。”
微軟研究院發表了一篇研究論文,您可以在其中找到有關這項新技術的更多(技術)細節—— 前往此鏈接以找到它。 儘管如此,您如何看待這項新技術? 在下面的評論部分讓我們知道。