Microsoft Research entwickelt mit seinem Projekt „Situated Interaction“ einen intelligenten virtuellen Assistenten

Symbol für die Lesezeit 3 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Lesen Sie weiter

Virtueller Assistent von Microsoft Monica

Während wir alle darauf warten, den digitalen Assistenten Cortana auf Windows Phone 8.1 auszuprobieren, arbeitet Microsoft Research an virtuellen Assistenten, die Ihre Arbeit im wirklichen Leben im Umgang mit anderen Menschen und mehr erledigen können. Das langfristige Ziel von Microsoft Research der Situierte Interaktion Das Projekt soll eine neue Generation interaktiver Systeme ermöglichen, die Interaktion und Berechnung tief in den natürlichen Ablauf alltäglicher Aufgaben, Aktivitäten und Kooperationen einbetten. Beispielszenarien umfassen Mensch-Roboter-Interaktion, E-Home, interaktive Werbetafeln, Systeme, die Expertenteams durch komplexe Aufgaben und Verfahren überwachen, unterstützen und koordinieren usw.

Ein solcher Assistent könnte sich mit den Assistenten anderer Personen koordinieren und dabei helfen, soziale Verpflichtungen, Arbeitsverpflichtungen und Reisen zu planen. Es könnte Ihre Bedürfnisse auf der Grundlage vergangener Aktivitäten vorhersehen – z. B. wo Sie gerne gegessen haben – und sich mit Unternehmen abstimmen, die Sonderangebote anbieten. Es könnte Ihnen helfen, einen Film auszuwählen, der Ihren Freunden gefällt.

„Intelligente, unterstützende Assistenten, die Menschen unterstützen und ergänzen, sind ein zentrales Bestreben der Informatik“, sagt Horvitz, „und die Grundlagenforschung in diesem Bereich umfasst das Sammeln von Daten und das Beobachten von Menschen, die sich unterhalten, zusammenarbeiten und sich gegenseitig helfen, damit wir lernen können, wie wir am besten vorgehen Systeme entwickeln, die diese Rolle übernehmen können.“

Der aktuelle virtuelle Assistent Monica von Microsoft verfügt über die folgenden Interaktionsfunktionen.

Grundlegende Interaktion: veranschaulicht eine grundlegende Einzelteilnehmer-Interaktion mit dem System. Beachten Sie die verschiedenen Ebenen der Szenenanalyse (das System verfolgt das Gesicht und die Pose des Benutzers, leitet Informationen über Kleidung, Zugehörigkeit, Aufgabenziele usw. ab) und das natürliche Interaktionsmodell (das System greift ein, wenn sich der Benutzer nähert).
Szene Schlussfolgerungen und Erdung: Systems leitet Benutzerziele aus der Szenenanalyse ab (Benutzer ist formell gekleidet, daher höchstwahrscheinlich extern, möchte daher wahrscheinlich Registrierung), begründet diese Informationen jedoch durch Dialog. Beachten Sie auch die Erdung der Gebäudenummer.
Aufmerksamkeitsmodellierung und Engagement: Systems überwacht die Aufmerksamkeit des Benutzers (unter Verwendung von Informationen aus dem Gesichtsdetektor und Pose-Tracker) und bindet den Benutzer entsprechend ein.
Umgang mit wartenden Personen: Das System überwacht mehrere Benutzer in der Szene und erkennt die Anwesenheit eines wartenden Benutzers mit einem kurzen Blick (roter Punkt zeigt den Blick des Systems) und durch vorübergehendes Einbinden gegen Ende des Gesprächs
Wiedereingliederung: wie oben, nur dass der anfängliche Benutzer beim Zurückschalten des Systems nicht mehr aufpasst. Da das System weiß, dass eine Person in der Schlange wartet, lenkt es die Aufmerksamkeit des Benutzers und greift erneut ein, indem es „Entschuldigung!“ sagt.
Dialog mit mehreren Teilnehmern: Das System schließt aus der Szene (und bestätigt durch Dialog), dass die beiden Teilnehmer zusammen in einer Gruppe sind. Das System führt dann ein Gespräch mit mehreren Teilnehmern weiter. Beachten Sie das Blickmodell (roter Punkt), das Informationen darüber enthält, wer der sprechende Teilnehmer ist, sowie bestimmte Elemente in der Diskursstruktur.
Dialog mit mehreren Teilnehmern mit Nebengespräch: ähnlich wie bei der vorherigen Interaktion; Am Ende führen die Benutzer ein Nebengespräch. Das System versteht, dass die Äußerungen nicht an es gerichtet sind, und unterbricht nach einer Weile die beiden Benutzer, um die Shuttle-Informationen zu übermitteln. Beachten Sie auch die Touchscreen-Interaktion, die als Fallback für Fälle verwendet wird, in denen die Spracherkennung fehlschlägt.
Mehrteilnehmerdialog mit wartender dritter Person: Dies veranschaulicht auch, wie das System mit einem wartenden Teilnehmer umgeht, während es mit einer Gruppe von zwei Benutzern interagiert.

Lesen Sie mehr über dieses Projekt von Microsoft Research.

Mehr zu den Themen: Microsoft, Forschungsprojekte, Roboter, Situierte Interaktion, smart, Virtueller Assistent

Hinterlassen Sie uns einen Kommentar

E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind MIT * gekennzeichnet. *