טכנולוגיית זיהוי הדיבור של מיקרוסופט מדויקת כעת יותר מאי פעם

סמל זמן קריאה 2 דקות לקרוא

סמל לוח השנה פורסם ב אוגוסט

פורסם ב אוגוסט

קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו.

טכנולוגיית זיהוי הדיבור של מיקרוסופט רק פגעה בדיוק ברמת האדם. צוות המחקר של החברה הודיע כי למערכת זיהוי הדיבור שלה יש כעת שיעור שגיאות מילים (WER) של 5.1% בלבד. זה ירידה מה-WER הקודם של המערכת של 5.9%. רדמונד קידמה ללא הרף את מערכת זיהוי הדיבור שלה במהלך השנה והצליחה להוריד אותה ל-5.1% מ- 6.3% WER שהשיגה בספטמבר של השנה שעברה. החברה הצליחה להפחית את שיעור השגיאות שלה ב-12% עצום במהלך השנה האחרונה.

דיווחים קודמים הראו ששיעור הטעות במילה אנושית הוא כרגע בשיעור של 5,1%, מה שאומר שמערכת זיהוי הדיבור של מיקרוסופט היא למעשה מדויקת כמו בני אדם. זה הישג די עצום מצדה של מיקרוסופט, שכן היא ניסתה להגיע לשוויון אנושי ב-25 השנים האחרונות.

רדמונד פירט כיצד הוא משיג את שיעור השגיאות הנמוך יותר באמצעות שילוב של רשת עצבית קונבולוציונית וזיכרון דו-כיווני לטווח ארוך לטווח קצר. דו"ח טכני. מהנדסים במיקרוסופט עבדו גם על שיפור המודלים האקוסטיים והשפה מבוססי הרשת העצבית שלה, ותורמים לשיפור שיעור שגיאות המילים. החברה גם טוענת שהשקעתה בעסקי הענן אפשרה תהליך הדרכה מהיר יותר למודלים האקוסטיים והשפה שלה.

טכנולוגיית זיהוי הדיבור של מיקרוסופט בשימוש ב-Windows, Cortana, Office, Cognitive Services והדיוק המשופר, ככל הנראה, יועילו כמעט לכל לקוחותיה בחודשים הקרובים.

עוד על הנושאים: cnn, Cortana, מיקרוסופט, זיהוי דיבור, WER, שיעור שגיאות מילה

מהדי חסן

כתב טכנולוגיה

מהדי חסן הוא כתב חדשות ב-MSPowerUser.com. הוא מכסה את כל החדשות האחרונות מעולם הטכנולוגיה.

השאירו תגובה