SIGMA von Microsoft ist für reale Aufgaben konzipiert. So gelangt KI durch HoloLens in Ihre Augen

Ich für reale Aufgaben für HoloLens 2

Symbol für die Lesezeit 2 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Mehr erfahren

Wichtige Hinweise

  • Microsoft stellt SIGMA vor, eine Open-Source-Plattform für reale Aufgaben
  • SIGMA verbindet Mixed Reality und KI und bietet eine Schritt-für-Schritt-Anleitung durch HoloLens 2
  • Aufgaben können vordefiniert oder dynamisch sein, wobei Sprach- und Bildverarbeitungsmodelle die Objekterkennung und Benutzerabfragen unterstützen

Microsoft-Forscher haben gerade angekündigt am Montag die Einführung von SIGMA. Die Abkürzung steht für „Situated Interactive Guidance, Monitoring, and Assistance“ und ist eine „Open-Source-Forschungsplattform und Testbed-Prototyp“, die für reale Aufgaben entwickelt wurde. 

Jetzt verfügbar am GitHubSIGMA ist ein interaktives Tool, das für HoloLens 2 entwickelt wurde und Mixed Reality und KI-Technologie verbindet. Es unterstützt Benutzer bei der Ausführung Schritt-für-Schritt-Aufgaben, indem es Anleitungen gibt und Fragen beantwortet, oder einfacher gesagt, es lässt die KI in Ihre Augen eindringen. 

Aufgaben können dann vordefiniert oder dynamisch generiert werden, und SIGMA verwendet Sprach- und Bildmodelle, um relevante Objekte in der Umgebung zu erkennen und hervorzuheben. Mithilfe von Vision-Modellen wie Detic und SEEM kann es auch Benutzerfragen beantworten und aufgabenrelevante Objekte in der Umgebung erkennen.

„SIGMA wurde als Forschungsplattform konzipiert. Unser Ziel bei der Open-Sourcing-Lösung des Systems besteht darin, anderen Forschern dabei zu helfen, die grundlegenden technischen Herausforderungen bei der Erstellung einer interaktiven Full-Stack-Anwendung zu meistern“, sagt Microsoft.

SIGMA basiert auf dem Framework „Platform for Location Intelligence“ und ermöglicht schnelles Prototyping sowie Tools für Visualisierung, Debugging und Wartung. Das System ist mit einer Client-Server-Architektur konzipiert, die es ermöglicht, Datenströme von HoloLens 2 auf einem Desktop-Server zu verarbeiten und dabei Gerätebeschränkungen zu umgehen. 

Microsoft steht schon seit geraumer Zeit an der Spitze des KI-Rennens. Das in Redmond ansässige Unternehmen Milliarden von Dollar in Investitionen in OpenAI, seine Anzahl von KI-Modellenund der Copilot-KI-Tool in Windows 11/10 und mobilen Geräten sind nur einige Beispiele. 

Benutzerforum

0 Nachrichten