پیشرفت مایکروسافت در فناوری ترجمه گفتار
2 دقیقه خواندن
منتشر شده در
صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب
ریک رشید، مدیر ارشد تحقیقاتی مایکروسافت، در تیانجین، چین در رویداد محاسبات قرن بیست و یکم مایکروسافت تحقیقات آسیا نمایشی ارائه کرد. او در مورد تشخیص گفتار در محاسبات و پیشرفت اخیر مایکروسافت در آن بحث کرد.
با این حال، تا همین اواخر، حتی بهترین سیستمهای گفتاری هنوز نرخ خطای کلمهای بین 20 تا 25 درصد در گفتار دلخواه داشتند.
درست بیش از دو سال پیش، محققان مایکروسافت ریسرچ و دانشگاه تورنتو به پیشرفت دیگری دست یافتند. با استفاده از تکنیکی به نام شبکههای عصبی عمیق، که بر اساس رفتار مغز انسان طراحی شده است، محققان توانستند تشخیصدهندههای گفتار متمایزتر و بهتری را نسبت به روشهای قبلی آموزش دهند.
در جریان ارائه خود در 25 اکتبر در چین، من این فرصت را داشتم که آخرین نتایج این کار را به نمایش بگذارم. ما توانستهایم میزان خطای کلمات را در مقایسه با روشهای قبلی بیش از 30 درصد کاهش دهیم. این بدان معناست که به جای اینکه یک کلمه در 4 یا 5 اشتباه باشد، اکنون نرخ خطا یک کلمه در 7 یا 8 است. در حالی که هنوز تا کامل بودن فاصله دارد، این چشمگیرترین تغییر در دقت از زمان معرفی مدل سازی پنهان مارکوف در سال 1979 است. و همانطور که داده های بیشتری را به آموزش اضافه می کنیم، معتقدیم که حتی نتایج بهتری خواهیم گرفت.
او بعداً یک نمایش زنده از نتایج کاری که روی آن کار میکنند با ترجمه هر آنچه که به زبان انگلیسی به چینی در عرض چند ثانیه انجام میدهد، انجام داد. ویدیوی بالا را تماشا کنید تا جادو را ببینید!
از طریق: بعدی در مایکروسافت