La tecnología de reconocimiento de voz de Microsoft es ahora más precisa que nunca

Icono de tiempo de lectura 2 minuto. leer


Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces. Icono de información sobre herramientas

Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más

La tecnología de reconocimiento de voz de Microsoft acaba de alcanzar una precisión a nivel humano. El equipo de investigación de la empresa anunció que su sistema de reconocimiento de voz ahora tiene una tasa de error de palabras (WER) de solo el 5.1 %. Eso está por debajo del WER anterior del sistema de 5.9%. Redmond ha estado mejorando constantemente su sistema de reconocimiento de voz a lo largo del año y ha podido reducirlo al 5.1 % desde el 6.3% WER que logró en septiembre del año pasado La compañía pudo reducir su tasa de error en un 12% durante el último año.

Informes anteriores han demostrado que la tasa de error de palabra humana es actualmente en 5,1%, lo que significa que el sistema de reconocimiento de voz de Microsoft es tan preciso como los humanos. Ese es un gran logro por parte de Microsoft, ya que ha estado tratando de alcanzar la paridad humana durante los últimos 25 años.

Redmond detalló cómo está logrando la tasa de error más baja usando una combinación de una red neuronal convolucional y una memoria bidireccional a largo-corto plazo en un informe técnico. Los ingenieros de Microsoft también han estado trabajando para mejorar sus modelos acústicos y de lenguaje basados ​​en redes neuronales, lo que contribuye a mejorar la tasa de errores de palabras. La empresa también afirma que su inversión en el negocio de la nube ha permitido un proceso de formación más rápido para sus modelos acústicos y de lenguaje.

La tecnología de reconocimiento de voz de Microsoft utilizada en Windows, Cortana, Office, Cognitive Services y la precisión mejorada probablemente beneficiarán a casi todos sus clientes en los próximos meses.

Más sobre los temas: cnn, Cortana, microsoft, reconocimiento de voz, NOSOTROS SOMOS, Tasa de error de palabras