Microsofts talegenkendelsesteknologi er nu mere præcis end nogensinde før
2 min. Læs
Udgivet den
Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere
Microsofts talegenkendelsesteknologi ramte netop nøjagtigheden på menneskeligt niveau. Virksomhedens forskerhold meddelte, at dets talegenkendelsessystem nu har en Word Error Rate (WER) på kun 5.1 %. Det er et fald i forhold til systemets tidligere WER på 5.9 %. Redmond har konstant udviklet sit talegenkendelsessystem i løbet af året og har været i stand til at bringe det ned til 5.1 % fra 6.3 % WER det opnåede tilbage i september af sidste år. Virksomheden var i stand til at reducere sin fejlrate med hele 12 % i løbet af det sidste år.
Tidligere rapporter har vist, at den menneskelige ordfejlrate er i øjeblikket på 5,1 %, hvilket betyder, at Microsofts talegenkendelsessystem effektivt er lige så nøjagtigt som mennesker. Det er en ret stor præstation fra Microsofts side, da det har forsøgt at nå menneskelig paritet i de sidste 25 år.
Redmond detaljerede, hvordan det opnår den lavere fejlrate ved hjælp af en kombination af et foldet neuralt netværk og tovejs lang-korttidshukommelse på en teknisk rapport. Ingeniører hos Microsoft har også arbejdet på at forbedre sine neurale netbaserede akustiske og sproglige modeller, hvilket bidrager til den forbedrede ordfejlrate. Virksomheden hævder også, at dens investering i cloud-forretningen har muliggjort en hurtigere træningsproces for dets akustiske og sproglige modeller.
Microsofts talegenkendelsesteknologi brugt på tværs af Windows, Cortana, Office, Cognitive Services og den forbedrede nøjagtighed vil sandsynligvis gavne næsten alle dets kunder i de kommende måneder.