당신의 휴가 이야기를 들려줄 수 있는 AI를 연구하는 마이크로소프트 리서치

독서 시간 아이콘 2 분. 읽다


독자들은 MSpoweruser를 지원하는 데 도움을 줍니다. 당사의 링크를 통해 구매하시면 수수료를 받을 수 있습니다. 툴팁 아이콘

공개 페이지를 읽고 MSPoweruser가 편집팀을 유지하는 데 어떻게 도움을 줄 수 있는지 알아보세요. 자세히 보기

해변으로의 여행

사진을 설명할 수 있는 AI는 이미 인터넷에서 작동하고 있으며 예를 들어 Facebook의 사진에 캡션을 추가합니다. 이제 Microsoft Research는 기술을 한 단계 더 발전시켜 AI에게 일련의 사진에 대한 이야기를 들려줄 것을 요청합니다.

예를 들어, 이미지 캡션 프로그램은 XNUMX개의 이미지를 찍고 "이것은 가족 사진입니다. 이것은 케이크 사진입니다. 이것은 개 사진입니다. 이것은 해변의 사진입니다.” 스토리텔링 프로그램은 같은 이미지를 찍고 “가족이 모여서 요리를 했습니다. 그들은 맛있는 음식을 많이 먹었습니다. 개는 거기에 행복했습니다. 그들은 해변에서 즐거운 시간을 보냈습니다. 그들은 심지어 물에서 수영을 했습니다.”

미래에 컴퓨터화된 스토리텔링은 사람들이 소셜 미디어에 업로드하는 이미지의 슬라이드쇼에 대한 이야기를 자동으로 생성하는 데 도움이 될 것이라고 Mitchell은 말했습니다. 그녀는 "사람들이 자신의 경험을 공유할 수 있도록 도우면서 일부 사람들이 상당히 지루하게 여기는 핵심적인 작업을 줄일 수 있습니다."라고 말했습니다. 전산화된 스토리텔링은 "시각 장애가 있는 사람들이 볼 수 없는 사람들에게 이미지를 열어주는 데 도움이 될 수도 있습니다."

연구의 선임 저자인 마가렛 미첼(Margaret Mitchell)은 "목표는 AI에 인간과 유사한 지능을 제공하고 더 추상적인 수준에서 사물을 이해하도록 돕는 것"이라고 말했다. 마이크로소프트 리서치. “사람들은 우리의 도덕과 전략, 지혜를 전달하기 위해 이야기를 사용하여 오랜 세월 동안 이야기를 전해 왔습니다. 스토리텔링에 중점을 두고 AI가 인류를 이기는 방법을 가르치는 것이 아니라 인류에게 매우 안전하고 유익한 방식으로 인간 개념을 이해하도록 돕기를 희망합니다.”

AI가 이미지 시퀀스를 기반으로 이야기를 전달하는 방법을 배운다면 "비디오에서도 동일한 작업을 수행하는 디딤돌"이라고 Mitchell은 말했습니다. "그것은 흥미로운 응용 프로그램을 제공하는 데 도움이 될 수 있습니다. 예를 들어, 보안 카메라의 경우 주목할 만한 사항에 대한 요약을 원하거나 자동으로 트윗 이벤트를 생중계할 수 있습니다.”라고 그녀가 말했습니다.

연구원들은 이번 달 말에 샌디에이고에서 열리는 전산 언어학 협회 북미 지부의 연례 회의에서 연구 결과를 발표할 예정입니다.

주제에 대한 추가 정보: ai, 마이크로 소프트 연구