Microsoft Research murtaa "ihmisen puheentunnistuksen esteen"
2 min. lukea
Julkaistu
Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää
Microsoft Research on tehnyt suuren läpimurron puheentunnistuksessa. He ovat nyt kehittäneet järjestelmän, joka ymmärtää keskustelun yhtä hyvin kuin ihminen. Heidän puheentunnistusjärjestelmänsä tekee saman tai vähemmän virheitä kuin ammattimaiset transkriptioijat. Tutkijat ilmoittivat, että sanavirheprosentti (WER) oli 5.9 prosenttia, kun ryhmä raportoi vain viime kuussa 6.3 prosentista. Se on alhaisin koskaan tallennettu alan standardinmukaiseen Switchboardin puheentunnistustehtävään verrattuna.
"Olemme saavuttaneet ihmisten pariteetin", sanoi Xuedong Huang, yhtiön johtava puhetieteilijä. "Tämä on historiallinen saavutus."
”En olisi edes viisi vuotta sitten uskonut, että olisimme voineet saavuttaa tämän. En vain olisi uskonut sen olevan mahdollista”, sanoi Harry Shum, varatoimitusjohtaja, joka johtaa Microsoftin tekoäly- ja tutkimusryhmää.
"Tämä saavutus on yli kahdenkymmenen vuoden ponnistelun huipentuma", sanoi Geoffrey Zweig, joka johtaa Speech & Dialog -tutkimusryhmää.
Tämä läpimurtotutkimus parantaa puheentunnistusominaisuuksia useissa Microsoft-tuotteissa, mukaan lukien kuluttajaviihdelaitteet, kuten Xbox, esteettömyystyökalut, kuten välitön puheen tekstiksi transkriptio, ja henkilökohtaiset digitaaliset avustajat, kuten Cortana.
"Tämä tekee Cortanasta tehokkaamman ja tekee todella älykkään avustajan mahdolliseksi", Shum sanoi.
Lue koko tarina tätä.