IBM supera a Microsoft em precisão de reconhecimento de fala
2 minutos. ler
Publicado em
Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais
No ano passado, a Microsoft fez um avanço bastante impressionante no reconhecimento de fala. A empresa alegou que sua tecnologia de reconhecimento de fala atingiu “paridade humana” com apenas 5.9% de WER (Word Error Rate). E agora, a IBM alcançou um WER ainda menor com sua tecnologia de reconhecimento de fala. A empresa afirma que alcançou uma taxa de erro de palavras de 5.5%, superando o recorde de 5.9% da Microsoft em 0.4%.
Microsoft anteriormente bateu o recorde de WER de 6.9% da IBM alcançando uma taxa de erro de 6.3% em setembro de 2016. Portanto, provavelmente não demorará muito até que a Microsoft revide a IBM.
O interessante é que a IBM afirma que a empresa ainda não atingiu a paridade humana. Ao contrário da Microsoft, a IBM afirma que a paridade humana está em um WER de 5.1% - o que ainda não foi alcançado por nenhuma tecnologia de reconhecimento de fala. George Saon, um cientista de pesquisa principal da IBM disse:
“Atingir a paridade humana – o que significa uma taxa de erro equivalente à de dois humanos falando – tem sido o objetivo final da indústria. Outros na indústria estão perseguindo esse marco ao nosso lado, e alguns afirmaram recentemente atingir 5.9% como equivalente à paridade humana... mas ainda não estamos estourando o champanhe. Como parte de nosso processo para alcançar o marco de hoje, determinamos que a paridade humana é realmente menor do que qualquer um já alcançou – em 5.1%.”
A IBM disse em um post no blog que a empresa foi capaz de atingir uma taxa de erro menor do que a Microsoft combinando os modelos de linguagem LSTM (Long Short Term Memory) e WaveNet.