Microsoft Research pracuje nad technologią rozpoznawania cichych poleceń głosowych

Ikona czasu czytania 2 minuta. czytać


Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków. Ikona podpowiedzi

Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej

Microsoft pracuje nad nowym interfejsem wprowadzania głosowego, który pozwoli użytkownikom mówić i nagrywać bez wycieków głosu. Badanie jest prowadzone przez Microsoft Research i zostało zaprezentowane w UIST 2018.

Moduł o nazwie SilentVoice będzie przechwytywał powietrze wydobywające się z ust i nagrywał głos, nie przeszkadzając otaczającym ludziom. Co więcej, moduł filtruje również otaczający głos, dzięki czemu użytkownik może przechwytywać czysty głos nawet bez zakłóceń z zewnątrz.

SilentVoice to nowy interfejs głosowego wprowadzania danych, który w codziennym życiu przenika do naturalnego interfejsu użytkownika opartego na mowie (NUI). Proponowana metoda „mowy inwazyjnej” umożliwia umieszczenie mikrofonu bardzo blisko przedniej części ust bez powodowania trzasków, rejestrując bardzo ciche dźwięki mowy z dobrym stosunkiem S/N. Realizuje bardzo mały (mniej niż 39 dB(A)) wyciek głosu, co pozwala nam korzystać z wprowadzania głosowego bez denerwowania otoczenia w sytuacjach publicznych i mobilnych, a także w biurach i domach. Mierząc kierunek przepływu powietrza, SilentVoice można łatwo oddzielić od normalnych wypowiedzi z dokładnością 98.8%; nie są potrzebne żadne słowa aktywacyjne. Może być używany w systemach aktywowanych głosem ze specjalnie wyszkolonym rozpoznawaniem głosu; wyniki oceny dają współczynniki błędów słów (WER) na poziomie 1.8% (warunek zależny od mówiącego) i 7.0% (warunek niezależny od mówiącego) przy ograniczonym słowniku 85 zdań poleceń. Naturalny głos przypominający szept może być również używany do komunikacji głosowej w czasie rzeczywistym.

- Microsoft

Możesz obejrzeć poniższy film, aby zobaczyć, jak to działa.

Technologia jest nadal w fazie badań, ale z pewnością pomoże ludziom nagrywać głos, a także pracować bez przeszkadzania tym, którzy są wokół nich.

Źródło: Microsoft; Przez: WalkingCat

Więcej na tematy: Microsoft, badania Microsoft

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *