A Microsoft beszédfelismerő technológiája most minden eddiginél pontosabb
2 perc olvas
Publikálva
Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább
A Microsoft beszédfelismerő technológiája elérte az emberi szintű pontosságot. A vállalat kutatócsoportja bejelentette, hogy beszédfelismerő rendszerének Word Error Rate (WER) már csak 5.1%-a. Ez alacsonyabb, mint a rendszer korábbi 5.9%-os WER-je. Redmond az év során folyamatosan fejlesztette beszédfelismerő rendszerét, és 5.1%-ra tudta csökkenteni azt 6.3% WER elérte még szeptemberben a tavalyi évről. A vállalat az elmúlt év során 12%-kal tudta csökkenteni a hibaarányát.
Korábbi jelentések kimutatták, hogy az emberi szavak hibaaránya az jelenleg 5,1%, ami azt jelenti, hogy a Microsoft beszédfelismerő rendszere olyan pontos, mint az embereké. Ez elég hatalmas eredmény a Microsoft részéről, hiszen az elmúlt 25 évben próbálta elérni az emberi paritást.
Redmond részletesen bemutatta, hogyan éri el az alacsonyabb hibaarányt a konvolúciós neurális hálózat és a kétirányú hosszú, rövid távú memória kombinációjával. technikai jelentés. A Microsoft mérnökei a neurális háló alapú akusztikai és nyelvi modelljei fejlesztésén is dolgoznak, hozzájárulva a szóhibaarány javulásához. A vállalat azt is állítja, hogy a felhő üzletágba való befektetése gyorsabb képzési folyamatot tett lehetővé az akusztikus és nyelvi modelljei számára.
A Microsoft Windows, Cortana, Office és Cognitive Services rendszerben használt beszédfelismerő technológiája, valamint a megnövelt pontosság valószínűleg szinte minden ügyfelének hasznára válik a következő hónapokban.