Microsoftin puheentunnistustekniikka on nyt tarkempi kuin koskaan ennen

Lukuajan kuvake 2 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Microsoftin puheentunnistustekniikka osui juuri ihmistason tarkkuuteen. Yrityksen tutkimusryhmä ilmoitti, että sen puheentunnistusjärjestelmän WER (Word Error Rate) on nyt vain 5.1 %. Se on pienempi kuin järjestelmän aiempi WER 5.9 %. Redmond on jatkuvasti kehittänyt puheentunnistusjärjestelmäänsä vuoden aikana ja on pystynyt laskemaan sen 5.1 prosenttiin. 6.3 % WER saavutettiin syyskuussa viime vuodesta. Yhtiö pystyi vähentämään virhetasoaan huimat 12 prosenttia viime vuoden aikana.

Aiemmat raportit ovat osoittaneet, että ihmisten sanojen virheprosentti on tällä hetkellä 5,1 %, mikä tarkoittaa, että Microsoftin puheentunnistusjärjestelmä on yhtä tarkka kuin ihmiset. Se on melkoinen saavutus Microsoftilta, sillä se on yrittänyt saavuttaa ihmisten pariteetin viimeisen 25 vuoden ajan.

Redmond selvitti, kuinka se saavuttaa alhaisemman virhesuhteen käyttämällä konvoluutiohermoverkkoa ja kaksisuuntaista lyhytaikaista muistia. tekninen raportti. Microsoftin insinöörit ovat myös pyrkineet parantamaan sen hermoverkkoon perustuvia akustisia ja kielimalleja, mikä on osaltaan parantanut sanavirheiden määrää. Yhtiö väittää myös, että sen investointi pilviliiketoimintaan on mahdollistanut nopeamman koulutusprosessin sen akustisille ja kielimalleille.

Microsoftin Windowsissa, Cortanassa, Officessa ja kognitiivisissa palveluissa käytettävä puheentunnistustekniikka ja parantunut tarkkuus hyödyttävät todennäköisesti lähes kaikkia sen asiakkaita tulevina kuukausina.

Lisää aiheista: CNN, Cortana, microsoft, puheentunnistus, WER, Sanavirhe

Jätä vastaus

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *