Microsoft Research buduje inteligentnego wirtualnego asystenta dzięki zlokalizowanemu projektowi interakcji

Ikona czasu czytania 3 minuta. czytać

Ikona kalendarza Opublikowany 9 kwietnia 2014 r.

opublikowane w dniu 9 kwietnia 2014 r.

Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków.

Podczas gdy wszyscy czekamy na wypróbowanie cyfrowej asystentki Cortany w systemie Windows Phone 8.1, Microsoft Research pracuje nad wirtualnymi asystentami, którzy mogą obsługiwać Twoją pracę w prawdziwym życiu, mając do czynienia z innymi ludźmi i nie tylko. Długoterminowy cel Microsoft Research dotyczący Umiejscowiona interakcja Projekt ma na celu umożliwienie nowej generacji systemów interaktywnych, które osadzają interakcję i obliczenia głęboko w naturalnym przepływie codziennych zadań, czynności i współpracy. Przykładowe scenariusze obejmują interakcję człowiek-robot, e-home, interaktywne billboardy, systemy monitorujące, wspomagające i koordynujące zespoły ekspertów poprzez złożone zadania i procedury itp.

Taki asystent mógłby koordynować pracę z asystentami innych osób, pomagając w planowaniu spotkań towarzyskich, zobowiązań w pracy i podróży. Może przewidywać Twoje potrzeby w oparciu o przeszłe czynności — na przykład miejsce, w którym jadłeś posiłek — i koordynować działania z firmami oferującymi specjalne oferty. Pomoże Ci wybrać film na podstawie tego, który lubili Twoi znajomi.

„Inteligentni, wspierający asystenci, którzy pomagają i uzupełniają ludzi, są kluczowymi aspiracjami w informatyce”, mówi Horvitz, „a podstawowe badania w tej przestrzeni obejmują zbieranie danych i obserwowanie ludzi rozmawiających, współpracujących i pomagających sobie nawzajem, abyśmy mogli dowiedzieć się, jak najlepiej rozwijać systemy, które mogą służyć w tej roli.”

Obecny asystent wirtualny Monica firmy Microsoft ma następujące funkcje interakcji.

Podstawowa interakcja: ilustruje podstawową interakcję pojedynczego uczestnika z systemem. Zwróć uwagę na różne warstwy analizy sceny (system śledzi twarz i pozę użytkownika, podaje informacje o ubiorze, przynależności, celach zadania itp.) oraz naturalny model zaangażowania (system angażuje się, gdy użytkownik się zbliża)

Wnioskowanie i uziemienie sceny: system wyprowadza cele użytkownika z analizy sceny (użytkownik jest ubrany formalnie, a więc najprawdopodobniej zewnętrzny, stąd prawdopodobnie chce się zarejestrować), ale uzasadnia tę informację poprzez dialog. Zwróć także uwagę na uziemienie numeru budynku.

Modelowanie uwagi i zaangażowanie: systemy monitorują uwagę użytkownika (korzystając z informacji z detektora twarzy i śledzenia pozy) i odpowiednio angażują użytkownika.

Obsługa osób czekających w kolejce: system monitoruje wielu użytkowników na scenie i szybko potwierdza obecność oczekującego użytkownika (czerwona kropka pokazuje wzrok systemu) oraz poprzez tymczasowe angażowanie ich pod koniec rozmowy

Ponowne zaangażowanie: tak samo jak powyżej, z tą różnicą, że gdy system się cofa, początkowy użytkownik nie zwraca już uwagi. Wiedząc, że dana osoba czeka w kolejce, system zwraca uwagę użytkownika i ponownie angażuje, mówiąc „Przepraszam!”

Okno dialogowe dla wielu uczestników: system wnioskuje ze sceny (i potwierdza poprzez dialog), że dwaj uczestnicy są razem w grupie. System następnie prowadzi rozmowę z wieloma uczestnikami. Zwróć uwagę na model spojrzenia (czerwona kropka), czyli informacja o tym, kto jest mówiącym uczestnikiem, a także pewne elementy w strukturze dyskursu.

Dialog z wieloma uczestnikami z rozmową poboczną: podobny do poprzedniej interakcji; na końcu użytkownicy angażują się w poboczną rozmowę. System rozumie, że wypowiedzi nie są do niego adresowane i po chwili przerywa dwóm użytkownikom przekazanie informacji wahadłowca. Zwróć także uwagę na interakcję z ekranem dotykowym, która jest używana jako rozwiązanie awaryjne w przypadku awarii rozpoznawania mowy.

Dialog z wieloma uczestnikami z oczekującą trzecią osobą: ilustruje to również, w jaki sposób system obsługuje oczekującego uczestnika podczas interakcji z grupą dwóch użytkowników.

Przeczytaj więcej o tym projekcie od Microsoft Research.

Więcej na tematy: Microsoft, Badania naukowe, roboty, Umiejscowiona interakcja, mądry, Wirtualny asystent

Pradeepa Viswava

Ekspert ds. oprogramowania i usług

Pradeep jest absolwentem informatyki i inżynierii. Był także partnerem studenckim firmy Microsoft. Obecnie pracuje w wiodącej firmie informatycznej.

Dodaj komentarz