IBM slår Microsoft med talegenkendelses nøjagtighed
2 min. Læs
Udgivet den
Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere
Sidste år fik Microsoft et ret imponerende gennembrud inden for talegenkendelse. Virksomheden hævdede, at dets talegenkendelsesteknologi nåede "menneskelig paritet" med kun 5.9 pct. af WER (Word Error Rate). Og nu har IBM opnået en endnu lavere WER med sin talegenkendelsesteknologi. Virksomheden hævder, at den har opnået en ordfejlrate på 5.5 %, hvilket slog Microsofts rekord på 5.9 % med 0.4 %.
Microsoft tidligere slog IBM's 6.9% WER rekord ved at opnå en fejlrate på 6.3 % tilbage i september 2016. Så der går nok ikke længe, før Microsoft slår tilbage på IBM.
Det interessante er, at IBM hævder, at virksomheden endnu ikke har nået menneskelig paritet. I modsætning til Microsoft hævder IBM, at den menneskelige paritet er på en WER på 5.1 % - hvilket endnu ikke er opnået med nogen talegenkendelsesteknologi. George Saon, en IBM-hovedforsker sagde:
"At nå menneskelig paritet - hvilket betyder en fejlrate på niveau med to menneskers tal - har længe været industriens ultimative mål. Andre i branchen jagter denne milepæl ved siden af os, og nogle har for nylig hævdet, at de nåede 5.9 procent, hvilket svarer til menneskelig paritet...men vi spreder ikke champagnen endnu. Som en del af vores proces med at nå dagens milepæl, fastslog vi, at menneskelig paritet faktisk er lavere end hvad nogen endnu har opnået - på 5.1 procent."
IBM sagde i et blogindlæg, at virksomheden var i stand til at opnå en lavere fejlrate end Microsoft ved at kombinere LSTM (Long Short Term Memory) og WaveNet sprogmodeller.