מחקר של מיקרוסופט מנצח את המתחרים עם הציון הטוב ביותר אי פעם של זיהוי דיבור

סמל זמן קריאה 2 דקות לקרוא


קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו. סמל טיפים

קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קראו עוד

גל קול

בבלוג של מיקרוסופט הודיעה Microsoft Research כי מאמצי הבינה המלאכותית שלהם הגיעו לאבן דרך חדשה, כשהם משיגים ציון מוביל בתעשייה של 6.3% שיעור שגיאות מילים במבחן זיהוי דיבור סטנדרטי, משימת זיהוי הדיבור של Switchboard.

"המערכת הבודדת הטובה ביותר שלנו משיגה שיעור שגיאה של 6.9% בערכת המרכזייה של NIST 2000. אנו מאמינים שזהו הביצועים הטובים ביותר שדווחו עד כה עבור מערכת זיהוי שאינה מבוססת על שילוב מערכת. אנסמבל של דגמים אקוסטיים מקדם את המצב החדש ל-6.3% בנתוני הבדיקה של המרכזייה", ציין המדען במאמר מחקר.

המטרה הסופית היא לזהות דיבור כמו גם כל אדם אחר, מה שיגרום לעוזרי קול כמו Cortana אפילו יותר שימושיים.

"זהו רעיון פשוט, אך עם זאת הוא חזק מאוד בהשפעתו. מדובר בנטילת כוחה של השפה האנושית וליישם אותה באופן נרחב יותר על כל המחשוב שלנו", אמרה נאדלה באירוע מוקדם יותר השנה.

ג'פרי צווייג, חוקר ראשי ומנהל קבוצת המחקר 'דיבור ודיאלוג' של מיקרוסופט, הוביל את מאמץ זיהוי הדיבור של Centralboard. הוא מייחס את תוצאות זיהוי הדיבור המובילות של החברה לכישוריהם של החוקרים שלה, מה שהוביל לפיתוח של אלגוריתמי אימון חדשים, מודלים של רשתות עצביות קונבולוציונית וחוזרים, ופיתוח כלים כמו Computational Network  Toolkit. CNTK מיישמת אופטימיזציות מתוחכמות המאפשרות לאלגוריתמי למידה עמוקה לפעול בסדר גודל מהר יותר מבעבר. צעד מרכזי קדימה היה פריצת דרך לאימון מקביל על יחידות עיבוד גרפיות, או GPUs.

"צוות המחקר שהרכבנו מביא לידי ביטוי מאה שנים של ניסיון במחקר ופיתוח דיבור תעשייתי כדי לדחוף את הטכנולוגיה המתקדמת בטכנולוגיות זיהוי דיבור", אמר צווייג.

"ציון דרך חדש זה נהנה ממגוון רחב של טכנולוגיות חדשות שפותחו על ידי קהילת הבינה המלאכותית מארגונים רבים ושונים במהלך 20 השנים האחרונות", אמר שואדונג הואנג, מדען הדיבור הראשי של מיקרוסופט.

מוקדם יותר השנה זכו חוקרי מיקרוסופט באתגר הראייה הממוחשבת ImageNet. הטכנולוגיה מצאה את ביתה במספר מוצרי מיקרוסופט, כולל האפליקציה הויראלית HowOldAmI.net.

עוד על הנושאים: מחקר, זיהוי דיבור