IBM slår Microsoft med talegenkendelses nøjagtighed

Ikon for læsetid 2 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

Sidste år fik Microsoft et ret imponerende gennembrud inden for talegenkendelse. Virksomheden hævdede, at dets talegenkendelsesteknologi nåede "menneskelig paritet" med kun 5.9 pct. af WER (Word Error Rate). Og nu har IBM opnået en endnu lavere WER med sin talegenkendelsesteknologi. Virksomheden hævder, at den har opnået en ordfejlrate på 5.5 %, hvilket slog Microsofts rekord på 5.9 % med 0.4 %.

Microsoft tidligere slog IBM's 6.9% WER rekord ved at opnå en fejlrate på 6.3 % tilbage i september 2016. Så der går nok ikke længe, ​​før Microsoft slår tilbage på IBM.

Det interessante er, at IBM hævder, at virksomheden endnu ikke har nået menneskelig paritet. I modsætning til Microsoft hævder IBM, at den menneskelige paritet er på en WER på 5.1 % - hvilket endnu ikke er opnået med nogen talegenkendelsesteknologi. George Saon, en IBM-hovedforsker sagde:

"At nå menneskelig paritet - hvilket betyder en fejlrate på niveau med to menneskers tal - har længe været industriens ultimative mål. Andre i branchen jagter denne milepæl ved siden af ​​os, og nogle har for nylig hævdet, at de nåede 5.9 procent, hvilket svarer til menneskelig paritet...men vi spreder ikke champagnen endnu. Som en del af vores proces med at nå dagens milepæl, fastslog vi, at menneskelig paritet faktisk er lavere end hvad nogen endnu har opnået - på 5.1 procent."

IBM sagde i et blogindlæg, at virksomheden var i stand til at opnå en lavere fejlrate end Microsoft ved at kombinere LSTM (Long Short Term Memory) og WaveNet sprogmodeller.

Mere om emnerne: Cortana, ibm, IBM Labs, IBM talegenkendelse, microsoft, Microsoft-forskning, MSR, tale genkendelse