IBM перевершує Microsoft за точністю розпізнавання мовлення
2 хв. читати
Опубліковано
Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі
Минулого року Microsoft зробила досить вражаючий прорив у розпізнаванні мовлення. Компанія стверджувала, що її технологія розпізнавання мови досягла «людський паритет» лише з 5.9% WER (Частота помилок у словах). І тепер IBM досягла ще нижчого WER за допомогою своєї технології розпізнавання мовлення. Компанія стверджує, що вона досягла 5.5% помилок у словах, побивши рекорд Microsoft у 5.9% на 0.4%.
Microsoft раніше побив рекорд IBM 6.9% WER досягнувши рівня помилок у 6.3% у вересні 2016 року. Тож, ймовірно, скоро Microsoft відповість на IBM.
Цікаво те, що IBM стверджує, що компанія ще не досягла людського рівня. На відміну від Microsoft, IBM стверджує, що рівень людського відношення дорівнює 5.1% — цього ще не досягнуто жодною технологією розпізнавання мовлення. Джордж Сон, головний науковий співробітник IBM, сказав:
«Досягнення людської паритетності — тобто рівня помилок, рівного рівню розмові двох людей — уже давно є головною метою галузі. Інші представники галузі прагнуть досягти цієї віхи разом з нами, і деякі нещодавно заявили, що досягли 5.9 відсотка, що еквівалентно людському паритету… але ми ще не розливаємо шампанське. У рамках нашого процесу досягнення сьогоднішньої віхи ми визначили, що рівень людських ресурсів насправді нижчий, ніж будь-хто досі досягав — 5.1 відсотка».
У дописі в блозі IBM заявила, що компанія змогла досягти нижчого рівня помилок, ніж Microsoft, поєднавши LSTM (довгокороткострокова пам’ять) і мовні моделі WaveNet.