Výskum spoločnosti Microsoft poráža súperov najlepším skóre v benchmarku rozpoznávania reči

Ikona času čítania 2 min. čítať


Čítačky pomáhajú podporovať MSpoweruser. Ak nakupujete prostredníctvom našich odkazov, môžeme získať províziu. Ikona popisu

Prečítajte si našu informačnú stránku a zistite, ako môžete pomôcť MSPoweruser udržať redakčný tím Čítaj viac

hlasová vlna

Na blogu Microsoftu Microsoft Research oznámil, že ich úsilie o umelú inteligenciu zasiahlo nový míľnik, keď v štandardizovanom teste rozpoznávania reči, úlohe rozpoznávania reči prepínača, dosiahlo popredné skóre v odvetví 6.3 % Word Error Rate.

„Náš najlepší samostatný systém dosahuje chybovosť 6.9 % na súprave ústrední NIST 2000. Domnievame sa, že ide o doteraz najlepší výkon systému rozpoznávania, ktorý nie je založený na kombinácii systémov. Súbor akustických modelov posúva súčasný stav techniky na 6.3 % na testovacích údajoch ústredne,“ poznamenal vedec. vo výskumnom článku.

Konečným cieľom je rozpoznať reč rovnako ako akúkoľvek inú osobu, vďaka čomu by boli hlasoví asistenti, ako je Cortana, ešte užitočnejší.

„Je to jednoduchý koncept, no má veľmi silný vplyv. Ide o prevzatie sily ľudského jazyka a jeho prenikavejšie uplatnenie na všetky naše výpočtové systémy,“ povedal Nadella na podujatí začiatkom tohto roka.

Geoffrey Zweig, hlavný výskumník a manažér výskumnej skupiny Speech & Dialog spoločnosti Microsoft, viedol úsilie v oblasti rozpoznávania reči v ústredni. Popredné výsledky rozpoznávania reči spoločnosti pripisuje schopnostiam jej výskumníkov, čo viedlo k vývoju nových cvičných algoritmov, vysoko optimalizovaných konvolučných a rekurentných modelov neurónových sietí a vývoju nástrojov, ako je Computational Network Toolkit. CNTK implementuje sofistikované optimalizácie, ktoré umožňujú algoritmom hlbokého učenia bežať rádovo rýchlejšie ako predtým. Kľúčovým krokom vpred bol prielom v paralelnom školení na grafických procesoroch alebo GPU.

„Výskumný tím, ktorý sme zostavili, prináša storočie skúseností z priemyselného výskumu a vývoja reči, aby posunul najmodernejšie technológie rozpoznávania reči,“ povedal Zweig.

„Tento nový míľnik ťažil zo širokej škály nových technológií vyvinutých komunitou AI od mnohých rôznych organizácií za posledných 20 rokov,“ povedal Xuedong Huang, hlavný vedec reči spoločnosti Microsoft.

Začiatkom tohto roka výskumníci spoločnosti Microsoft vyhrali výzvu počítačového videnia ImageNet. Táto technológia si našla svoj domov v množstve produktov spoločnosti Microsoft, vrátane vírusovej aplikácie HowOldAmI.net.

Viac o témach: výskum spoločnosti Microsoft, rozpoznávanie reči