پیشرفت مایکروسافت در فناوری ترجمه گفتار

نماد زمان خواندن 2 دقیقه خواندن

نماد تقویم منتشر شده در نوامبر 8، 2012

منتشر شده در نوامبر 8، 2012

خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم.

ریک رشید، مدیر ارشد تحقیقاتی مایکروسافت، در تیانجین، چین در رویداد محاسبات قرن بیست و یکم مایکروسافت تحقیقات آسیا نمایشی ارائه کرد. او در مورد تشخیص گفتار در محاسبات و پیشرفت اخیر مایکروسافت در آن بحث کرد.

با این حال، تا همین اواخر، حتی بهترین سیستم‌های گفتاری هنوز نرخ خطای کلمه‌ای بین 20 تا 25 درصد در گفتار دلخواه داشتند.

درست بیش از دو سال پیش، محققان مایکروسافت ریسرچ و دانشگاه تورنتو به پیشرفت دیگری دست یافتند. با استفاده از تکنیکی به نام شبکه‌های عصبی عمیق، که بر اساس رفتار مغز انسان طراحی شده است، محققان توانستند تشخیص‌دهنده‌های گفتار متمایزتر و بهتری را نسبت به روش‌های قبلی آموزش دهند.

در جریان ارائه خود در 25 اکتبر در چین، من این فرصت را داشتم که آخرین نتایج این کار را به نمایش بگذارم. ما توانسته‌ایم میزان خطای کلمات را در مقایسه با روش‌های قبلی بیش از 30 درصد کاهش دهیم. این بدان معناست که به جای اینکه یک کلمه در 4 یا 5 اشتباه باشد، اکنون نرخ خطا یک کلمه در 7 یا 8 است. در حالی که هنوز تا کامل بودن فاصله دارد، این چشمگیرترین تغییر در دقت از زمان معرفی مدل سازی پنهان مارکوف در سال 1979 است. و همانطور که داده های بیشتری را به آموزش اضافه می کنیم، معتقدیم که حتی نتایج بهتری خواهیم گرفت.

او بعداً یک نمایش زنده از نتایج کاری که روی آن کار می‌کنند با ترجمه هر آنچه که به زبان انگلیسی به چینی در عرض چند ثانیه انجام می‌دهد، انجام داد. ویدیوی بالا را تماشا کنید تا جادو را ببینید!

از طریق: بعدی در مایکروسافت

بیشتر در مورد موضوعات: مایکروسافت, تحقیق, سخنرانی

اخبار مایکروسافت

اتاق خبر

Microsoft News تیم اتاق خبر سابق MSPowerUser است. امروز، ما با خبرنگاران و گزارش‌های مختلفی کار می‌کنیم که اخبار و رویدادها را به ما اطلاع می‌دهند.

پاسخ دهید