سرویس متن به گفتار Microsoft Azure اکنون سبک‌های صوتی و احساسی با صدای طبیعی را ارائه می‌دهد

نماد زمان خواندن 2 دقیقه خواندن

نماد تقویم منتشر شده در آوریل 2، 2020

منتشر شده در آوریل 2، 2020

خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم.

سرویس متن به گفتار مایکروسافت خدمات شناختی، متن را به گفتار برای رابط های طبیعی تر تبدیل می کند. توسعه دهندگان می توانند از این سرویس برای ساخت برنامه ها و سرویس هایی که به طور طبیعی صحبت می کنند استفاده کنند. به لطف تحقیقات پیشرفت در فناوری سنتز گفتار، سرویس متن به گفتار مایکروسافت در حال حاضر گفتاری روان و با صدای طبیعی ارائه می دهد که با الگوهای استرس و آهنگ صدای انسان مطابقت دارد. امروز، مایکروسافت سه سبک صوتی جدید و سبک های احساسی را معرفی کرد که به توسعه دهندگان امکان انتخاب بیشتر در انتخاب سبک گفتار برای برنامه هایشان را می دهد.

مایکروسافت سه سبک صوتی زیر را اعلام می کند:

پخش خبری - با صدای عصبی TTS در سبک پخش خبری، کاربران شما می توانند از گوش دادن به اخبار یا مقالات با لحنی حرفه ای لذت ببرند که منعکس کننده آنچه ممکن است در برنامه های خبری تلویزیونی یا رادیویی بشنوید.
خدمات مشتری – سبک خدمات مشتری دارای لحنی دوستانه و جذاب است و برای سناریوهایی که شامل پشتیبانی مشتری می‌شود، مانند ورود فردی به پرواز، رزرو رستوران، یا گزارش ادعا، مناسب است.
دستیار دیجیتال - بسیاری از مشتریان از صدای TTS عصبی برای راه حل های دستیار دیجیتال خود استفاده می کنند. ما دو سبک را در این زمینه معرفی می‌کنیم: یک سبک چت برای ربات‌های معمولی و محاوره‌ای و یک سبک حرفه‌ای‌تر برای سناریوهایی مانند دستیارهای دیجیتال داخل خودرو.

مایکروسافت سه سبک احساسی زیر را اعلام می کند:

بشاش
همدلانه
غزلی

گفتار به سبک پخش خبری قبلاً در برنامه تلفن همراه بینگ استفاده شده است، ویدیوی آزمایشی زیر را بررسی کنید.

منبع: مایکروسافت

بیشتر در مورد موضوعات: سبک های احساسی, مایکروسافت لاورو, متن به گفتار, سبک های صوتی

پرادیپ ویسواو

کارشناس نرم افزار و خدمات

پرادیپ فارغ التحصیل رشته مهندسی و علوم کامپیوتر است. او همچنین شریک دانشجویی مایکروسافت بود. او در حال حاضر در یک شرکت پیشرو فناوری اطلاعات مشغول به کار است.

پاسخ دهید