יבמ מנצחת את מיקרוסופט ברמת הדיוק של זיהוי דיבור

סמל זמן קריאה 2 דקות לקרוא


קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו. סמל טיפים

קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קרא עוד

בשנה שעברה, מיקרוסופט עשתה פריצת דרך די מרשימה בתחום זיהוי דיבור. החברה טענה שטכנולוגיית זיהוי הדיבור שלה הגיעה "שוויון אנושי" עם רק 5.9% של WER (שיעור שגיאות מילה). ועכשיו, IBM השיגה WER נמוך עוד יותר עם טכנולוגיית זיהוי הדיבור שלה. החברה טוענת שהיא השיגה שיעור שגיאות מילים של 5.5%, והביסה את השיא של מיקרוסופט של 5.9% ב-0.4%.

מיקרוסופט בעבר ניצחה את שיא ה-WER של IBM של 6.9%. על ידי השגת שיעור שגיאות של 6.3% בספטמבר 2016. אז כנראה שלא יעבור זמן רב עד שמיקרוסופט תחזור ל-IBM.

מה שמעניין הוא ש-IBM טוענת שהחברה עדיין לא הגיעה לשוויון אנושי. בניגוד למיקרוסופט, IBM טוענת שהשוויון האנושי עומד על WER של 5.1% - שעדיין לא הושג על ידי טכנולוגיית זיהוי דיבור כלשהי. ג'ורג' סאון, מדען מחקר ראשי של IBM אמר:

"הגעה לשוויון אנושי - כלומר שיעור שגיאה בדומה לזה של שני בני אדם המדברים - היא כבר מזמן המטרה הסופית בתעשייה. אחרים בתעשייה רודפים אחרי אבן הדרך הזו לצדנו, וחלקם טענו לאחרונה שהגיעו ל-5.9 אחוזים כשווי ערך לשוויון אנושי... אבל אנחנו עדיין לא מוציאים את השמפניה. כחלק מהתהליך שלנו להגיע לאבן הדרך של היום, קבענו שהשוויון האנושי הוא למעשה נמוך ממה שמישהו עדיין השיג - ב-5.1 אחוזים".

IBM אמרה בפוסט בבלוג כי החברה הצליחה להשיג שיעור שגיאות נמוך יותר ממיקרוסופט על ידי שילוב מודלים של LSTM (Long Short Term Memory) ו-WaveNet.

עוד על הנושאים: Cortana, יבמ, מעבדות IBM, זיהוי דיבור של IBM, מיקרוסופט, מחקר, MSR, זיהוי דיבור

השאירו תגובה

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *