Microsoft Research bryder igennem "den menneskelige talegenkendelsesbarriere"
2 min. Læs
Udgivet den
Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere
Microsoft Research har lavet et stort gennembrud inden for talegenkendelse. De har nu udviklet et system, der forstår en samtale lige så godt, som en person gør. Deres talegenkendelsessystem laver de samme eller færre fejl end professionelle transskriptionister. Forskerne rapporterede en ordfejlrate (WER) på 5.9 procent, ned fra de 6.3 procent WER, som holdet rapporterede i sidste måned. Det er det laveste, der nogensinde er registreret i forhold til industristandarden Tavle-talegenkendelsesopgave.
"Vi har nået menneskelig paritet," sagde Xuedong Huang, virksomhedens ledende taleforsker. "Dette er en historisk præstation."
“Selv for fem år siden havde jeg ikke troet, at vi kunne have opnået dette. Jeg ville bare ikke have troet, det ville være muligt,” sagde Harry Shum, den executive vice president, der leder Microsofts kunstig intelligens og forskningsgruppe.
"Denne bedrift er kulminationen på over tyve års indsats," sagde Geoffrey Zweig, der leder forskergruppen Tale & Dialog.
Denne banebrydende forskning vil forbedre talegenkendelsesfunktionerne i forskellige Microsoft-produkter, herunder underholdningsenheder til forbrugere som Xbox, tilgængelighedsværktøjer såsom øjeblikkelig tale-til-tekst-transskription og personlige digitale assistenter såsom Cortana.
"Dette vil gøre Cortana mere kraftfuld, hvilket gør en virkelig intelligent assistent mulig," sagde Shum.
Læs hele historien link..