טכנולוגיית זיהוי הדיבור של מיקרוסופט מדויקת כעת יותר מאי פעם

סמל זמן קריאה 2 דקות לקרוא


קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו. סמל טיפים

קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קרא עוד

טכנולוגיית זיהוי הדיבור של מיקרוסופט רק פגעה בדיוק ברמת האדם. צוות המחקר של החברה הודיע ​​כי למערכת זיהוי הדיבור שלה יש כעת שיעור שגיאות מילים (WER) של 5.1% בלבד. זה ירידה מה-WER הקודם של המערכת של 5.9%. רדמונד קידמה ללא הרף את מערכת זיהוי הדיבור שלה במהלך השנה והצליחה להוריד אותה ל-5.1% מ- 6.3% WER שהשיגה בספטמבר של השנה שעברה. החברה הצליחה להפחית את שיעור השגיאות שלה ב-12% עצום במהלך השנה האחרונה.

דיווחים קודמים הראו ששיעור הטעות במילה אנושית הוא כרגע בשיעור של 5,1%, מה שאומר שמערכת זיהוי הדיבור של מיקרוסופט היא למעשה מדויקת כמו בני אדם. זה הישג די עצום מצדה של מיקרוסופט, שכן היא ניסתה להגיע לשוויון אנושי ב-25 השנים האחרונות.

רדמונד פירט כיצד הוא משיג את שיעור השגיאות הנמוך יותר באמצעות שילוב של רשת עצבית קונבולוציונית וזיכרון דו-כיווני לטווח ארוך לטווח קצר. דו"ח טכני. מהנדסים במיקרוסופט עבדו גם על שיפור המודלים האקוסטיים והשפה מבוססי הרשת העצבית שלה, ותורמים לשיפור שיעור שגיאות המילים. החברה גם טוענת שהשקעתה בעסקי הענן אפשרה תהליך הדרכה מהיר יותר למודלים האקוסטיים והשפה שלה.

טכנולוגיית זיהוי הדיבור של מיקרוסופט בשימוש ב-Windows, Cortana, Office, Cognitive Services והדיוק המשופר, ככל הנראה, יועילו כמעט לכל לקוחותיה בחודשים הקרובים.

עוד על הנושאים: cnn, Cortana, מיקרוסופט, זיהוי דיבור, WER, שיעור שגיאות מילה

השאירו תגובה

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *