مایکروسافت کاهش نویز مبتنی بر هوش مصنوعی را به تیم های مایکروسافت در مک و پلتفرم های موبایل ارائه خواهد کرد
3 دقیقه خواندن
منتشر شده در
صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب
ماه گذشته ، مایکروسافت اعلام کرد قابلیت سرکوب نویز مبتنی بر هوش مصنوعی در پسزمینه بلادرنگ برای کاربران دسکتاپ Windows Teams منتشر شد. این ویژگی میتواند سر و صدای غیرضروری مانند به هم زدن کاغذها، کوبیدن درها و پارس کردن سگها را در طول تماس تیمها سرکوب کند. سرکوب نویز مبتنی بر هوش مصنوعی با تجزیه و تحلیل فید صوتی افراد و استفاده از شبکههای عصبی عمیق آموزشدیده برای فیلتر کردن نویز و حفظ تنها سیگنال گفتار کار میکند. مایکروسافت امروز اعلام کرد که در تلاش است تا سرکوب نویز مبتنی بر هوش مصنوعی را به تیم های مایکروسافت در سیستم عامل های مک و موبایل بیاورد.
مایکروسافت امروز همچنین توضیح داد که چگونه این ویژگی را بدون استفاده از داده های واقعی مشتری توسعه داده است. مایکروسافت مدل یادگیری عمیق را به گونه ای بهینه کرد که بتواند به طور کارآمد بر روی کلاینت دسکتاپ Teams در زمان واقعی و بدون هزینه زیاد اجرا شود.
برای دستیابی به این تنوع مجموعه داده، ما یک مجموعه داده بزرگ با تقریباً 760 ساعت داده گفتار تمیز و 180 ساعت داده نویز ایجاد کردهایم. برای پیروی از استانداردهای سختگیرانه حریم خصوصی مایکروسافت، اطمینان حاصل کردیم که هیچ داده مشتری برای این مجموعه داده جمع آوری نمی شود. درعوض، یا از دادههای در دسترس عمومی یا جمعسپاری برای جمعآوری سناریوهای خاص استفاده کردیم. برای گفتار تمیز، ما اطمینان حاصل کردیم که بین گفتار زنانه و مردانه تعادلی داریم و دادههایی را از بیش از 10 زبان جمعآوری کردیم که شامل زبانهای آهنگی نیز میشود تا اطمینان حاصل کنیم که مدل ما با تحریف لحن کلمات، معنای جمله را تغییر نخواهد داد. برای دادههای نویز، 150 نوع نویز را گنجاندهایم تا اطمینان حاصل کنیم که سناریوهای مختلفی را پوشش میدهیم که ممکن است مشتریانمان با آن مواجه شوند، از تایپ کردن با صفحهکلید گرفته تا سیفون توالت یا خروپف. جنبه مهم دیگر این بود که احساسات را در گفتار پاک خود بگنجانیم تا عباراتی مانند خنده یا گریه سرکوب نشود. ویژگیهای محیطی که مشتریان ما از آنجا به جلسات تیمهای آنلاین خود میپیوندند، تأثیر زیادی بر سیگنال گفتار نیز دارد. برای دریافت این تنوع، مدل خود را با داده های بیش از 3,000 محیط اتاق واقعی و بیش از 115,000 اتاق ساخته شده مصنوعی آموزش دادیم.
از آنجایی که ما از یادگیری عمیق استفاده می کنیم، داشتن یک زیرساخت آموزشی مدل قدرتمند مهم است. ما از Microsoft Azure استفاده می کنیم تا به تیم خود اجازه دهیم نسخه های بهبود یافته مدل ML ما را توسعه دهند. چالش دیگر این است که استخراج گفتار تمیز اصلی از سر و صدا باید به گونه ای انجام شود که گوش انسان طبیعی و خوشایند درک کند. از آنجایی که هیچ معیار عینی که ارتباط زیادی با ادراک انسان داشته باشد، وجود ندارد، ما چارچوبی را ایجاد کردیم که به ما امکان میدهد نمونههای صوتی پردازش شده را برای فروشندگان جمعسپاری بفرستیم، جایی که شنوندگان انسانی کیفیت صدای خود را در مقیاس یک تا پنج ستاره رتبهبندی میکنند تا امتیازات میانگین را ایجاد کنند. (MOS). با این رتبهبندیهای انسانی، ما توانستیم یک معیار ادراکی جدید ایجاد کنیم که همراه با رتبهبندیهای ذهنی انسانی به ما امکان پیشرفت سریع در بهبود کیفیت مدلهای یادگیری عمیق را میدهد.
در اینجا نحوه فعال کردن ویژگی سرکوب نویز در Teams آورده شده است:
- عکس نمایه خود را در سمت راست بالای Teams انتخاب کنید و سپس انتخاب کنید تنظیمات.
-
انتخاب کنید دستگاه ها در سمت چپ و سپس، زیر حذف سر و صدا، یک گزینه را انتخاب کنید.
- از پنجره جلسه:
- انتخاب کنید گزینه های بیشتر در کنترل های جلسه خود را انتخاب کنید و سپس انتخاب کنید تنظیمات دستگاه.
-
تحت حذف سر و صدا، یک گزینه را انتخاب کنید.
منبع: مایکروسافت