IBM превосходит Microsoft по точности распознавания речи
2 минута. читать
Опубликовано
Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее
В прошлом году Microsoft совершила довольно впечатляющий прорыв в распознавании речи. Компания заявила, что ее технология распознавания речи достигла «человеческий паритет» всего с 5.9% WER (Коэффициент ошибок в словах). А теперь IBM добилась еще более низкого WER благодаря своей технологии распознавания речи. Компания утверждает, что она достигла уровня ошибок в словах 5.5%, побив рекорд Microsoft в 5.9% на 0.4%.
Майкрософт ранее побить рекорд IBM 6.9% WER достигнув уровня ошибок 6.3% еще в сентябре 2016 года. Так что, вероятно, скоро Microsoft нанесет ответный удар по IBM.
Что интересно, так это то, что IBM утверждает, что компания еще не достигла человеческого паритета. В отличие от Microsoft, IBM утверждает, что человеческая четность составляет WER 5.1%, что еще не достигнуто ни одной технологией распознавания речи. Джордж Саон, главный научный сотрудник IBM, сказал:
«Достижение человеческого паритета — то есть частоты ошибок, равной частоте речи двух людей — уже давно является конечной целью отрасли. Другие представители отрасли стремятся к этой вехе вместе с нами, а некоторые недавно заявили, что достижение 5.9 процента эквивалентно человеческому паритету… но мы пока не открываем шампанское. В рамках нашего процесса достижения сегодняшней вехи мы определили, что человеческий паритет на самом деле ниже, чем кто-либо еще достиг — на уровне 5.1 процента».
IBM сообщила в своем блоге, что компании удалось добиться более низкого уровня ошибок, чем у Microsoft, путем объединения языковых моделей LSTM (Long Short Term Memory) и WaveNet.