مایکروسافت کاهش نویز مبتنی بر هوش مصنوعی را به تیم های مایکروسافت در مک و پلتفرم های موبایل ارائه خواهد کرد

نماد زمان خواندن 3 دقیقه خواندن

نماد تقویم منتشر شده در دسامبر 17، 2020

منتشر شده در دسامبر 17، 2020

خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم.

ماه گذشته ، مایکروسافت اعلام کرد قابلیت سرکوب نویز مبتنی بر هوش مصنوعی در پس‌زمینه بلادرنگ برای کاربران دسکتاپ Windows Teams منتشر شد. این ویژگی می‌تواند سر و صدای غیرضروری مانند به هم زدن کاغذها، کوبیدن درها و پارس کردن سگ‌ها را در طول تماس تیم‌ها سرکوب کند. سرکوب نویز مبتنی بر هوش مصنوعی با تجزیه و تحلیل فید صوتی افراد و استفاده از شبکه‌های عصبی عمیق آموزش‌دیده برای فیلتر کردن نویز و حفظ تنها سیگنال گفتار کار می‌کند. مایکروسافت امروز اعلام کرد که در تلاش است تا سرکوب نویز مبتنی بر هوش مصنوعی را به تیم های مایکروسافت در سیستم عامل های مک و موبایل بیاورد.

مایکروسافت امروز همچنین توضیح داد که چگونه این ویژگی را بدون استفاده از داده های واقعی مشتری توسعه داده است. مایکروسافت مدل یادگیری عمیق را به گونه ای بهینه کرد که بتواند به طور کارآمد بر روی کلاینت دسکتاپ Teams در زمان واقعی و بدون هزینه زیاد اجرا شود.

برای دستیابی به این تنوع مجموعه داده، ما یک مجموعه داده بزرگ با تقریباً 760 ساعت داده گفتار تمیز و 180 ساعت داده نویز ایجاد کرده‌ایم. برای پیروی از استانداردهای سختگیرانه حریم خصوصی مایکروسافت، اطمینان حاصل کردیم که هیچ داده مشتری برای این مجموعه داده جمع آوری نمی شود. درعوض، یا از داده‌های در دسترس عمومی یا جمع‌سپاری برای جمع‌آوری سناریوهای خاص استفاده کردیم. برای گفتار تمیز، ما اطمینان حاصل کردیم که بین گفتار زنانه و مردانه تعادلی داریم و داده‌هایی را از بیش از 10 زبان جمع‌آوری کردیم که شامل زبان‌های آهنگی نیز می‌شود تا اطمینان حاصل کنیم که مدل ما با تحریف لحن کلمات، معنای جمله را تغییر نخواهد داد. برای داده‌های نویز، 150 نوع نویز را گنجانده‌ایم تا اطمینان حاصل کنیم که سناریوهای مختلفی را پوشش می‌دهیم که ممکن است مشتریانمان با آن مواجه شوند، از تایپ کردن با صفحه‌کلید گرفته تا سیفون توالت یا خروپف. جنبه مهم دیگر این بود که احساسات را در گفتار پاک خود بگنجانیم تا عباراتی مانند خنده یا گریه سرکوب نشود. ویژگی‌های محیطی که مشتریان ما از آنجا به جلسات تیم‌های آنلاین خود می‌پیوندند، تأثیر زیادی بر سیگنال گفتار نیز دارد. برای دریافت این تنوع، مدل خود را با داده های بیش از 3,000 محیط اتاق واقعی و بیش از 115,000 اتاق ساخته شده مصنوعی آموزش دادیم.

از آنجایی که ما از یادگیری عمیق استفاده می کنیم، داشتن یک زیرساخت آموزشی مدل قدرتمند مهم است. ما از Microsoft Azure استفاده می کنیم تا به تیم خود اجازه دهیم نسخه های بهبود یافته مدل ML ما را توسعه دهند. چالش دیگر این است که استخراج گفتار تمیز اصلی از سر و صدا باید به گونه ای انجام شود که گوش انسان طبیعی و خوشایند درک کند. از آنجایی که هیچ معیار عینی که ارتباط زیادی با ادراک انسان داشته باشد، وجود ندارد، ما چارچوبی را ایجاد کردیم که به ما امکان می‌دهد نمونه‌های صوتی پردازش شده را برای فروشندگان جمع‌سپاری بفرستیم، جایی که شنوندگان انسانی کیفیت صدای خود را در مقیاس یک تا پنج ستاره رتبه‌بندی می‌کنند تا امتیازات میانگین را ایجاد کنند. (MOS). با این رتبه‌بندی‌های انسانی، ما توانستیم یک معیار ادراکی جدید ایجاد کنیم که همراه با رتبه‌بندی‌های ذهنی انسانی به ما امکان پیشرفت سریع در بهبود کیفیت مدل‌های یادگیری عمیق را می‌دهد.

در اینجا نحوه فعال کردن ویژگی سرکوب نویز در Teams آورده شده است:

عکس نمایه خود را در سمت راست بالای Teams انتخاب کنید و سپس انتخاب کنید تنظیمات.
انتخاب کنید دستگاه ها در سمت چپ و سپس، زیر حذف سر و صدا، یک گزینه را انتخاب کنید.
از پنجره جلسه:
1. انتخاب کنید گزینه های بیشتر در کنترل های جلسه خود را انتخاب کنید و سپس انتخاب کنید تنظیمات دستگاه.
2. تحت حذف سر و صدا، یک گزینه را انتخاب کنید.

منبع: مایکروسافت

بیشتر در مورد موضوعات: مایکروسافت, تیم های مایکروسافت, تیم

پرادیپ ویسواو

کارشناس نرم افزار و خدمات

پرادیپ فارغ التحصیل رشته مهندسی و علوم کامپیوتر است. او همچنین شریک دانشجویی مایکروسافت بود. او در حال حاضر در یک شرکت پیشرو فناوری اطلاعات مشغول به کار است.

پاسخ دهید