Microsoftova tehnologija za prepoznavanje govora je zdaj natančnejša kot kdaj koli prej

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

Microsoftova tehnologija za prepoznavanje govora je pravkar dosegla natančnost na ravni ljudi. Raziskovalna skupina podjetja je objavila, da ima njen sistem za prepoznavanje govora zdaj le 5.1-odstotno stopnjo besednih napak (WER). To je manj od prejšnjega sistema WER za 5.9 %. Redmond je skozi leto nenehno izpopolnjeval svoj sistem za prepoznavanje govora in ga je uspelo znižati na 5.1 % od 6.3 % WER je dosegel septembra lanskega leta. Podjetje je v zadnjem letu uspelo zmanjšati stopnjo napake za neverjetnih 12 %.

Prejšnja poročila so pokazala, da je stopnja napak pri človeških besedah trenutno na 5,1%, kar pomeni, da je Microsoftov sistem za prepoznavanje govora enako natančen kot ljudje. To je s strani Microsofta precej velik dosežek, saj se zadnjih 25 let trudi doseči človeško enakost.

Redmond je podrobno opisal, kako dosega nižjo stopnjo napak s kombinacijo konvolucijske nevronske mreže in dvosmernega dolgoročnega kratkoročnega spomina na Tehnično poročilo. Inženirji pri Microsoftu delajo tudi na izboljšanju svojih akustičnih in jezikovnih modelov, ki temeljijo na nevronski mreži, kar prispeva k izboljšani stopnji besednih napak. Podjetje tudi trdi, da je njegova naložba v poslovanje v oblaku omogočila hitrejši proces usposabljanja za njegove akustične in jezikovne modele.

Microsoftova tehnologija za prepoznavanje govora, ki se uporablja v sistemih Windows, Cortana, Office, Cognitive Services, in izboljšana natančnost bodo verjetno koristili skoraj vsem njegovim strankam v prihodnjih mesecih.

Več o temah: Dnevnik, Cortana, microsoft, prepoznavanje govora, WER, Stopnja napake besed