Microsoft Research bryter gjennom "menneskelig talegjenkjenningsbarriere"

Ikon for lesetid 2 min. lese


Lesere hjelper til med å støtte MSpoweruser. Vi kan få provisjon hvis du kjøper gjennom lenkene våre. Verktøytipsikon

Les vår avsløringsside for å finne ut hvordan du kan hjelpe MSPoweruser opprettholde redaksjonen Les mer

For Microsoft Technology and Research: Et forskerteam fotografert i Microsofts Building 99 i Redmond, Washington torsdag 13. oktober 2016. Foto av Dan DeLong
For Microsoft Technology and Research: Et forskerteam fotografert i Microsofts Building 99 i Redmond, Washington torsdag 13. oktober 2016. Foto av Dan DeLong

Microsoft Research har gjort et stort gjennombrudd innen talegjenkjenning. De har nå utviklet et system som forstår en samtale like godt som en person gjør. Talegjenkjenningssystemet deres gjør de samme eller færre feil enn profesjonelle transkripsjonister. Forskerne rapporterte en ordfeilrate (WER) på 5.9 prosent, ned fra 6.3 prosent WER teamet rapporterte bare forrige måned. Det er det laveste som noen gang er registrert i forhold til bransjestandarden sentralbords talegjenkjenningsoppgave.

"Vi har nådd menneskelig paritet," sa Xuedong Huang, selskapets sjef for taleforsker. – Dette er en historisk prestasjon.

«Selv for fem år siden hadde jeg ikke trodd at vi kunne ha oppnådd dette. Jeg hadde bare ikke trodd det ville være mulig, sa han Harry Shum, konserndirektøren som leder Microsofts gruppe for kunstig intelligens og forskning.

"Denne prestasjonen er kulminasjonen av over tjue års innsats," sa Geoffrey Zweig, som leder forskergruppen Tale og dialog.

Denne banebrytende forskningen vil forbedre talegjenkjenningsfunksjonene i ulike Microsoft-produkter, inkludert forbrukerunderholdningsenheter som Xbox, tilgjengelighetsverktøy som umiddelbar tale-til-tekst-transkripsjon og personlige digitale assistenter som Cortana.

"Dette vil gjøre Cortana kraftigere, og gjøre en virkelig intelligent assistent mulig," sa Shum.

Les hele historien her..

Mer om temaene: Gjennombrudd, microsoft, Microsoft-teknologi, Forskning, talegjenkjenning

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket *