IBM schlägt Microsoft bei der Genauigkeit der Spracherkennung

Symbol für die Lesezeit 2 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Lesen Sie weiter

Letztes Jahr gelang Microsoft ein ziemlich beeindruckender Durchbruch bei der Spracherkennung. Das Unternehmen behauptete, dass seine Spracherkennungstechnologie erreicht habe „menschliche Parität“ mit nur 5.9 % von WER (Wortfehlerrate). Und jetzt hat IBM mit seiner Spracherkennungstechnologie eine noch niedrigere WER erreicht. Das Unternehmen behauptet, es habe eine Wortfehlerrate von 5.5 % erreicht und damit den Rekord von Microsoft von 5.9 % um 0.4 % übertroffen.

Microsoft zuvor schlug IBMs WER-Rekord von 6.9 % indem es im September 6.3 eine Fehlerquote von 2016 % erreichte. Es wird also wahrscheinlich nicht lange dauern, bis Microsoft bei IBM zurückschlägt.

Interessant ist, dass IBM behauptet, das Unternehmen habe noch keine menschliche Parität erreicht. Im Gegensatz zu Microsoft behauptet IBM, dass die menschliche Parität bei einer WER von 5.1 % liegt – was noch von keiner Spracherkennungstechnologie erreicht werden muss. George Saon, ein leitender IBM-Forschungswissenschaftler, sagte:

„Das Erreichen menschlicher Parität – d. h. eine Fehlerquote, die der von zwei Menschen beim Sprechen entspricht – ist seit langem das ultimative Ziel der Branche. Andere in der Branche jagen diesen Meilenstein neben uns, und einige haben kürzlich behauptet, 5.9 Prozent als Äquivalent zur menschlichen Parität erreicht zu haben … aber wir knallen noch nicht den Champagner. Als Teil unseres Prozesses zum Erreichen des heutigen Meilensteins haben wir festgestellt, dass die menschliche Parität tatsächlich niedriger ist als das, was bisher erreicht wurde – bei 5.1 Prozent.“

IBM sagte in einem Blogbeitrag, dass das Unternehmen durch die Kombination von LSTM- (Long Short Term Memory) und WaveNet-Sprachmodellen eine geringere Fehlerquote als Microsoft erreichen konnte.

Mehr zu den Themen: Cortana, ibm, IBM-Labors, IBM Spracherkennung, Microsoft, Microsoft Forschung, MSR, Spracherkennung

Hinterlassen Sie uns einen Kommentar

E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind MIT * gekennzeichnet. *