Microsoft Research rompe la "barrera del reconocimiento del habla humana"
2 minuto. leer
Publicado el
Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más
Microsoft Research ha hecho un gran avance en el reconocimiento de voz. Ahora han desarrollado un sistema que entiende una conversación tan bien como lo hace una persona. Su sistema de reconocimiento de voz comete los mismos o menos errores que los transcriptores profesionales. Los investigadores informaron una tasa de error de palabras (WER) del 5.9 por ciento, por debajo del WER del 6.3 por ciento que el equipo informó el mes pasado. Es el más bajo jamás registrado en comparación con la tarea de reconocimiento de voz Switchboard estándar de la industria.
“Hemos alcanzado la paridad humana”, dijo Xuedong Huang, el principal científico del habla de la compañía. “Este es un logro histórico”.
“Incluso hace cinco años, no habría pensado que podríamos haber logrado esto. Simplemente no hubiera pensado que sería posible”, dijo Harry Shum, el vicepresidente ejecutivo que dirige el grupo de investigación e inteligencia artificial de Microsoft.
“Este logro es la culminación de más de veinte años de esfuerzo”, dijo Geoffrey Zweig, que dirige el grupo de investigación Speech & Dialog.
Esta investigación innovadora mejorará las funciones de reconocimiento de voz en varios productos de Microsoft, incluidos los dispositivos de entretenimiento para el consumidor como Xbox, herramientas de accesibilidad como la transcripción instantánea de voz a texto y asistentes digitales personales como Cortana.
“Esto hará que Cortana sea más poderosa, haciendo posible un asistente verdaderamente inteligente”, dijo Shum.
Lea la historia completa esta página.