Microsoft Research pobjeđuje rivale s najboljim ocjenom za prepoznavanje govora ikada

Ikona vremena čitanja 2 min. čitati


Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza. Ikona opisa alata

Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više

glasovni val

Na Microsoftovom blogu Microsoft Research je objavio da su njihovi napori na umjetnoj inteligenciji dosegli novu prekretnicu, postigavši ​​vodeći rezultat u industriji od 6.3% Word Error Rate na standardiziranom testu prepoznavanja govora, zadatku za prepoznavanje govora Switchboard.

“Naš najbolji pojedinačni sustav postiže stopu pogreške od 6.9% na NIST 2000 Switchboard setu. Vjerujemo da je ovo najbolja izvedba zabilježena do sada za sustav za prepoznavanje koji se ne temelji na kombinaciji sustava. Skup akustičnih modela unapređuje najsuvremeniju tehnologiju na 6.3% na testnim podacima Switchboard-a”, istaknuo je znanstvenik u istraživačkom radu.

Krajnji cilj je prepoznati govor kao i bilo koju drugu osobu, što bi glasovne asistente poput Cortane učinilo još korisnijim.

“To je jednostavan koncept, ali je vrlo moćan u svom utjecaju. Radi se o preuzimanju moći ljudskog jezika i primjeni je na sve naše računalstvo”, rekao je Nadella na događaju ranije ove godine.

Geoffrey Zweig, glavni istraživač i menadžer Microsoftove istraživačke grupe Speech & Dialog, vodio je napore za prepoznavanje govora Switchboard. Vodeće rezultate prepoznavanja govora tvrtke u industriji pripisuje vještinama svojih istraživača, što je dovelo do razvoja novih algoritama za obuku, visoko optimiziranih modela konvolucijskih i rekurentnih neuronskih mreža i razvoja alata kao što je Computational Network Toolkit. CNTK implementira sofisticirane optimizacije koje omogućuju algoritmima dubokog učenja da rade za red veličine brže nego prije. Ključni korak naprijed bio je iskorak u paralelnom treningu na grafičkim procesorskim jedinicama ili GPU-ima.

“Istraživački tim koji smo okupili donosi stoljeće iskustva industrijskog istraživanja i razvoja govora kako bi potaknuo najsuvremeniju tehnologiju za prepoznavanje govora,” rekao je Zweig.

"Ova nova prekretnica imala je koristi od širokog spektra novih tehnologija koje je razvila AI zajednica iz mnogih različitih organizacija tijekom posljednjih 20 godina", rekao je Xuedong Huang, Microsoftov glavni znanstvenik za govor.

Ranije ove godine Microsoftovi istraživači osvojili su ImageNet izazov računalnog vida. Tehnologija je našla svoj dom u brojnim Microsoftovim proizvodima, uključujući virusnu aplikaciju HowOldAmI.net.

Više o temama: microsoft istraživanje, prepoznavanje govora