יבמ מנצחת את מיקרוסופט ברמת הדיוק של זיהוי דיבור

סמל זמן קריאה 2 דקות לקרוא

סמל לוח השנה פורסם ב במרץ 11, 2017

פורסם ב במרץ 11, 2017

קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו.

בשנה שעברה, מיקרוסופט עשתה פריצת דרך די מרשימה בתחום זיהוי דיבור. החברה טענה שטכנולוגיית זיהוי הדיבור שלה הגיעה "שוויון אנושי" עם רק 5.9% של WER (שיעור שגיאות מילה). ועכשיו, IBM השיגה WER נמוך עוד יותר עם טכנולוגיית זיהוי הדיבור שלה. החברה טוענת שהיא השיגה שיעור שגיאות מילים של 5.5%, והביסה את השיא של מיקרוסופט של 5.9% ב-0.4%.

מיקרוסופט בעבר ניצחה את שיא ה-WER של IBM של 6.9%. על ידי השגת שיעור שגיאות של 6.3% בספטמבר 2016. אז כנראה שלא יעבור זמן רב עד שמיקרוסופט תחזור ל-IBM.

מה שמעניין הוא ש-IBM טוענת שהחברה עדיין לא הגיעה לשוויון אנושי. בניגוד למיקרוסופט, IBM טוענת שהשוויון האנושי עומד על WER של 5.1% - שעדיין לא הושג על ידי טכנולוגיית זיהוי דיבור כלשהי. ג'ורג' סאון, מדען מחקר ראשי של IBM אמר:

"הגעה לשוויון אנושי - כלומר שיעור שגיאה בדומה לזה של שני בני אדם המדברים - היא כבר מזמן המטרה הסופית בתעשייה. אחרים בתעשייה רודפים אחרי אבן הדרך הזו לצדנו, וחלקם טענו לאחרונה שהגיעו ל-5.9 אחוזים כשווי ערך לשוויון אנושי... אבל אנחנו עדיין לא מוציאים את השמפניה. כחלק מהתהליך שלנו להגיע לאבן הדרך של היום, קבענו שהשוויון האנושי הוא למעשה נמוך ממה שמישהו עדיין השיג - ב-5.1 אחוזים".

IBM אמרה בפוסט בבלוג כי החברה הצליחה להשיג שיעור שגיאות נמוך יותר ממיקרוסופט על ידי שילוב מודלים של LSTM (Long Short Term Memory) ו-WaveNet.

עוד על הנושאים: Cortana, יבמ, מעבדות IBM, זיהוי דיבור של IBM, מיקרוסופט, מחקר, MSR, זיהוי דיבור

שון צ'אן

עיתונאי טק

שון צ'אן הוא עיתונאי טכנולוגי עם שנים של ניסיון. הוא מכסה בעיקר חדשות חומרה ובעיקר חדשות הקשורות לשבב מ-AMD, NVidia ואינטל.

השאירו תגובה