A Microsoft Research áttöri az "emberi beszédfelismerési korlátot"
2 perc olvas
Publikálva
Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább
A Microsoft Research jelentős áttörést ért el a beszédfelismerés terén. Mostanra olyan rendszert fejlesztettek ki, amely éppúgy megérti a beszélgetést, mint egy személy. A beszédfelismerő rendszerük ugyanolyan vagy kevesebb hibát követ el, mint a professzionális átírók. A kutatók 5.9 százalékos szóhibaarányról (WER) számoltak be, ami alacsonyabb a 6.3 százalékos WER-ről, amelyet a csapat csak a múlt hónapban jelentett. Ez a valaha feljegyzett legalacsonyabb az iparági szabványos kapcsolótábla beszédfelismerő feladatához képest.
„Elértük az emberi paritást” – mondta Xuedong Huang, a cég vezető beszédtudósa. – Ez történelmi eredmény.
„Még öt évvel ezelőtt sem gondoltam volna, hogy ezt elérjük. Egyszerűen nem gondoltam volna, hogy ez lehetséges” – mondta Harry Shum, az ügyvezető alelnök, aki a Microsoft Mesterséges Intelligencia és Kutatócsoport vezetője.
„Ez a teljesítmény több mint húsz évnyi erőfeszítés csúcspontja” – mondta Geoffrey Zweig, aki a Speech & Dialog kutatócsoportot irányítja.
Ez az áttörést jelentő kutatás javítani fogja a különböző Microsoft-termékek beszédfelismerő funkcióit, beleértve a fogyasztói szórakoztató eszközöket, például az Xboxot, a kisegítő eszközöket, például az azonnali beszéd-szöveg átírást és a személyi digitális asszisztenseket, mint például a Cortana.
„Ezáltal a Cortana erősebb lesz, és valóban intelligens asszisztens lesz elérhető” – mondta Shum.
Olvassa el a teljes történetet itt.