Microsoft Research преодолевает «барьер распознавания человеческой речи»
2 минута. читать
Опубликовано
Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее
Microsoft Research совершила большой прорыв в распознавании речи. Теперь они разработали систему, которая понимает разговор так же хорошо, как человек. Их система распознавания речи делает столько же или меньше ошибок, чем профессиональные транскрипционисты. Исследователи сообщили о частоте ошибок в словах (WER) в 5.9% по сравнению с 6.3% WER, о которых команда сообщила только в прошлом месяце. Это самый низкий показатель из когда-либо зарегистрированных для стандартной задачи распознавания речи Switchboard.
«Мы достигли человеческого паритета», — сказал Сюэдун Хуан, главный речевой ученый компании. «Это историческое достижение».
«Даже пять лет назад я бы не подумал, что мы сможем добиться такого. Я просто не думал, что это возможно», — сказал Гарри Шум, исполнительный вице-президент, возглавляющий группу искусственного интеллекта и исследований Microsoft.
«Это достижение является кульминацией более чем двадцатилетней работы», — сказал Джеффри Цвейг, который руководит исследовательской группой Speech & Dialog.
Это революционное исследование улучшит функции распознавания речи в различных продуктах Microsoft, включая потребительские развлекательные устройства, такие как Xbox, инструменты доступности, такие как мгновенная транскрипция речи в текст, и персональные цифровые помощники, такие как Cortana.
«Это сделает Cortana более мощной и сделает возможным создание по-настоящему интеллектуального помощника», — сказал Шам.
Читайте полный рассказ здесь.