پیشرفت مایکروسافت در فناوری ترجمه گفتار

نماد زمان خواندن 2 دقیقه خواندن


خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم. نماد راهنمای ابزار

صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب

ریک رشید، مدیر ارشد تحقیقاتی مایکروسافت، در تیانجین، چین در رویداد محاسبات قرن بیست و یکم مایکروسافت تحقیقات آسیا نمایشی ارائه کرد. او در مورد تشخیص گفتار در محاسبات و پیشرفت اخیر مایکروسافت در آن بحث کرد.

با این حال، تا همین اواخر، حتی بهترین سیستم‌های گفتاری هنوز نرخ خطای کلمه‌ای بین 20 تا 25 درصد در گفتار دلخواه داشتند.

درست بیش از دو سال پیش، محققان مایکروسافت ریسرچ و دانشگاه تورنتو به پیشرفت دیگری دست یافتند. با استفاده از تکنیکی به نام شبکه‌های عصبی عمیق، که بر اساس رفتار مغز انسان طراحی شده است، محققان توانستند تشخیص‌دهنده‌های گفتار متمایزتر و بهتری را نسبت به روش‌های قبلی آموزش دهند.

در جریان ارائه خود در 25 اکتبر در چین، من این فرصت را داشتم که آخرین نتایج این کار را به نمایش بگذارم. ما توانسته‌ایم میزان خطای کلمات را در مقایسه با روش‌های قبلی بیش از 30 درصد کاهش دهیم. این بدان معناست که به جای اینکه یک کلمه در 4 یا 5 اشتباه باشد، اکنون نرخ خطا یک کلمه در 7 یا 8 است. در حالی که هنوز تا کامل بودن فاصله دارد، این چشمگیرترین تغییر در دقت از زمان معرفی مدل سازی پنهان مارکوف در سال 1979 است. و همانطور که داده های بیشتری را به آموزش اضافه می کنیم، معتقدیم که حتی نتایج بهتری خواهیم گرفت.

او بعداً یک نمایش زنده از نتایج کاری که روی آن کار می‌کنند با ترجمه هر آنچه که به زبان انگلیسی به چینی در عرض چند ثانیه انجام می‌دهد، انجام داد. ویدیوی بالا را تماشا کنید تا جادو را ببینید!

از طریق: بعدی در مایکروسافت

بیشتر در مورد موضوعات: مایکروسافت, تحقیق, سخنرانی

پاسخ دهید

آدرس ایمیل شما منتشر نخواهد شد. بخشهای موردنیاز علامتگذاری شدهاند *