Microsoft의 음성 인식 기술은 이제 그 어느 때보다 정확해졌습니다.

독서 시간 아이콘 2 분. 읽다


독자들은 MSpoweruser를 지원하는 데 도움을 줍니다. 당사의 링크를 통해 구매하시면 수수료를 받을 수 있습니다. 툴팁 아이콘

공개 페이지를 읽고 MSPoweruser가 편집팀을 유지하는 데 어떻게 도움을 줄 수 있는지 알아보세요. 자세히 보기

Microsoft의 음성 인식 기술은 인간 수준의 정확도를 달성했습니다. 회사의 연구팀은 음성 인식 시스템의 WER(단어 오류율)이 5.1%에 불과하다고 발표했습니다. 이는 시스템의 이전 WER 5.9%에서 하락한 것입니다. Redmond는 한 해 동안 지속적으로 음성 인식 시스템을 발전시켜 왔으며 이를 기존의 5.1%로 낮출 수 있었습니다. 6.3월에 달성한 XNUMX% WER 작년의. 이 회사는 작년에 비해 오류율을 무려 12%나 줄일 수 있었습니다.

이전 보고서에 따르면 인간의 단어 오류율은 현재 5,1%, 이는 Microsoft의 음성 인식 시스템이 효과적으로 사람만큼 정확하다는 것을 의미합니다. 지난 25년 동안 인간과 동등한 수준에 도달하기 위해 노력해 온 Microsoft의 입장에서는 이는 상당히 큰 성과입니다.

Redmond는 합성곱 신경망과 양방향 장단기 기억의 조합을 사용하여 더 낮은 오류율을 달성하는 방법을 자세히 설명했습니다. 기술 보고서. Microsoft의 엔지니어는 또한 신경망 기반 음향 및 언어 모델을 개선하여 단어 오류율을 개선하는 데 기여하고 있습니다. 회사는 또한 클라우드 비즈니스에 대한 투자로 음향 및 언어 모델에 대한 더 빠른 교육 프로세스가 가능했다고 주장합니다.

Windows, Cortana, Office, Cognitive Services에서 사용되는 Microsoft의 음성 인식 기술과 향상된 정확도는 앞으로 몇 달 안에 거의 모든 고객에게 혜택을 줄 것입니다.

주제에 대한 추가 정보: CNN, Cortana, 마이크로 소프트, 음성 인식, WER, 단어 오류율