Microsoft Research долає «бар’єр розпізнавання людської мови»
2 хв. читати
Опубліковано
Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі
Microsoft Research зробила великий прорив у розпізнаванні мовлення. Тепер вони розробили систему, яка розуміє розмову так само добре, як і людина. Їхня система розпізнавання мовлення робить такі ж помилки або менше, ніж професійні транскрипціоністи. Дослідники повідомили, що коефіцієнт помилки слів (WER) становить 5.9 відсотка, у порівнянні з 6.3 відсотка WER, про які команда повідомляла лише минулого місяця. Це найнижчий рівень, який коли-небудь був зафіксований у порівнянні зі стандартним завданням розпізнавання мовлення Switchboard.
"Ми досягли людського паритету", - сказав Сюедун Хуан, головний науковець з питань мовлення компанії. «Це історичне досягнення».
«Навіть п’ять років тому я б не подумав, що ми могли б цього досягти. Я б просто не подумав, що це можливо», – сказав Гаррі Шам, виконавчий віце-президент, який очолює групу зі штучного інтелекту та досліджень Microsoft.
«Це досягнення є кульмінацією понад двадцяти років зусиль», – сказав Джеффрі Цвейг, який керує дослідницькою групою Speech & Dialog.
Це проривне дослідження покращить функції розпізнавання мовлення в різних продуктах Microsoft, включаючи споживчі розважальні пристрої, такі як Xbox, інструменти доступності, такі як миттєва транскрипція мови в текст, і персональні цифрові помічники, такі як Cortana.
«Це зробить Cortana більш потужною, що зробить можливим справді розумного помічника», — сказав Шум.
Прочитайте повну історію тут.