IBM nadmašuje Microsoft u preciznosti prepoznavanja govora
2 min. čitati
Objavljeno na
Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više
Prošle godine Microsoft je napravio prilično impresivan napredak u prepoznavanju govora. Tvrtka je tvrdila da je njezina tehnologija prepoznavanja govora dosegla “ljudski paritet” sa samo 5.9% od WER (stopa pogreške riječi). A sada je IBM postigao još niži WER sa svojom tehnologijom prepoznavanja govora. Tvrtka tvrdi da je postigla stopu pogreške u riječi od 5.5%, nadmašivši Microsoftov rekord od 5.9% za 0.4%.
Microsoft ranije potukao IBM-ov rekord od 6.9% WER postigavši stopu pogreške od 6.3% još u rujnu 2016. Stoga vjerojatno neće proći dugo dok Microsoft ne uzvrati udarac IBM-u.
Ono što je zanimljivo je da IBM tvrdi da tvrtka tek treba postići ljudski paritet. Za razliku od Microsofta, IBM tvrdi da je ljudski paritet na WER-u od 5.1% — što tek treba postići bilo koja tehnologija prepoznavanja govora. George Saon, IBM-ov glavni istraživač je rekao:
„Postizanje ljudske ravnopravnosti – što znači stopu pogreške jednaku onoj kada razgovaraju dva čovjeka – dugo je bio krajnji cilj industrije. Drugi u industriji jure za ovom prekretnicom zajedno s nama, a neki su nedavno tvrdili da su dosegli 5.9 posto što je ekvivalent ljudskom paritetu...ali još ne bacamo šampanjac. Kao dio našeg procesa u dostizanju današnje prekretnice, utvrdili smo da je ljudski paritet zapravo niži od onoga što je itko dosad postigao - na 5.1 posto."
IBM je u postu na blogu rekao da je tvrtka uspjela postići nižu stopu pogreške od Microsofta kombinirajući jezične modele LSTM (Long Short Term Memory) i WaveNet.