Microsoft Research prebija "oviro za prepoznavanje človeškega govora"
2 min. prebrati
Objavljeno dne
Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več
Microsoft Research je naredil velik preboj pri prepoznavanju govora. Zdaj so razvili sistem, ki razume pogovor tako dobro kot oseba. Njihov sistem za prepoznavanje govora naredi enake ali manj napak kot profesionalni prepisovalci. Raziskovalci so poročali o stopnji besednih napak (WER) 5.9 odstotka, kar je manj od 6.3 odstotka WER, o katerih je ekipa poročala prejšnji mesec. To je najnižja doslej zabeležena v primerjavi s standardno nalogo prepoznavanja govora Switchboard.
"Dosegli smo človeško pariteto," je dejal Xuedong Huang, glavni znanstvenik za govor v podjetju. "To je zgodovinski dosežek."
»Še pred petimi leti si ne bi mislil, da bi to lahko dosegli. Preprosto si ne bi mislil, da bo to mogoče," je dejal Harry Shum, izvršni podpredsednik, ki vodi Microsoftovo skupino za umetno inteligenco in raziskave.
"Ta dosežek je vrhunec več kot dvajsetih let prizadevanj," je dejal Geoffrey Zweig, ki vodi raziskovalno skupino Speech & Dialog.
Ta prebojna raziskava bo izboljšala funkcije prepoznavanja govora v različnih Microsoftovih izdelkih, vključno z napravami za zabavo potrošnikov, kot je Xbox, orodji za dostopnost, kot je takojšnje prepisovanje govora v besedilo, in osebnimi digitalnimi pomočniki, kot je Cortana.
"S tem bo Cortana postala močnejša, kar bo omogočilo resnično inteligentnega pomočnika," je dejal Shum.
Preberite celotno zgodbo tukaj.