Microsoft Researchは、ホリデースナップのストーリーを伝えることができるAIを使用しています

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

ビーチへの旅

写真を説明できるAIはすでにインターネット上で機能しており、たとえばFacebookの写真にキャプションを追加しています。 現在、Microsoft Researchはテクノロジーを次のレベルに引き上げ、AIに一連の写真のストーリーを伝えるように依頼しています。

たとえば、画像キャプションプログラムでは、XNUMXつの画像を撮影して、「これは家族の写真です。 これはケーキの写真です。 これは犬の写真です。 これはビーチの写真です」とストーリーテリングプログラムは同じ画像を撮り、「家族は料理のために集まった。 彼らはたくさんのおいしい食べ物を食べました。 犬はそこにいて幸せでした。 彼らはビーチで素晴らしい時間を過ごしました。 彼らは水の中を泳ぐことさえしました。」

将来的には、コンピューター化されたストーリーテリングは、人々がソーシャルメディアにアップロードする画像のスライドショーの物語を自動的に生成するのに役立つ可能性があるとミッチェル氏は語った。 「一部の人々が非常に退屈だと感じる本質的な作業を減らしながら、人々が経験を共有するのを助けるでしょう」と彼女は言いました。 コンピューター化されたストーリーテリングは、「視覚障害者が画像を見ることができない人のために画像を開くのにも役立ちます。」

「目標は、AIに人間のような知性を与え、より抽象的なレベルで物事を理解できるようにすることです。これは、楽しい、不気味な、奇妙な、または興味深いことを意味します」と、研究の上級著者であるマーガレットミッチェルは述べています。マイクロソフトリサーチ。 「人々は私たちの道徳と戦略と知恵を伝えるためにそれらを使用して、何年にもわたって物語を伝えてきました。 ストーリーテリングに重点を置いて、AIが人類を打ち負かす方法を教えるのではなく、人類にとって非常に安全で有益な方法で人間の概念を理解できるように支援したいと考えています。」

AIが一連の画像に基づいてストーリーを語ることを学んだ場合、「それはビデオでも同じことを行うための足がかりになります」とミッチェル氏は述べています。 「それは興味深いアプリケーションを提供するのに役立つかもしれません。 たとえば、防犯カメラの場合、注目に値するものの要約が必要な場合もあれば、ツイートイベントを自動的にライブ配信する場合もあります」と彼女は言います。

研究者たちは、今月後半に計算言語学協会の北米支部の年次総会でサンディエゴでの調査結果を発表する予定です。

トピックの詳細: ai, マイクロソフトリサーチ