سرویس متن به گفتار Microsoft Azure اکنون سبکهای صوتی و احساسی با صدای طبیعی را ارائه میدهد
2 دقیقه خواندن
منتشر شده در
صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب
سرویس متن به گفتار مایکروسافت خدمات شناختی، متن را به گفتار برای رابط های طبیعی تر تبدیل می کند. توسعه دهندگان می توانند از این سرویس برای ساخت برنامه ها و سرویس هایی که به طور طبیعی صحبت می کنند استفاده کنند. به لطف تحقیقات پیشرفت در فناوری سنتز گفتار، سرویس متن به گفتار مایکروسافت در حال حاضر گفتاری روان و با صدای طبیعی ارائه می دهد که با الگوهای استرس و آهنگ صدای انسان مطابقت دارد. امروز، مایکروسافت سه سبک صوتی جدید و سبک های احساسی را معرفی کرد که به توسعه دهندگان امکان انتخاب بیشتر در انتخاب سبک گفتار برای برنامه هایشان را می دهد.
مایکروسافت سه سبک صوتی زیر را اعلام می کند:
- پخش خبری - با صدای عصبی TTS در سبک پخش خبری، کاربران شما می توانند از گوش دادن به اخبار یا مقالات با لحنی حرفه ای لذت ببرند که منعکس کننده آنچه ممکن است در برنامه های خبری تلویزیونی یا رادیویی بشنوید.
- خدمات مشتری – سبک خدمات مشتری دارای لحنی دوستانه و جذاب است و برای سناریوهایی که شامل پشتیبانی مشتری میشود، مانند ورود فردی به پرواز، رزرو رستوران، یا گزارش ادعا، مناسب است.
- دستیار دیجیتال - بسیاری از مشتریان از صدای TTS عصبی برای راه حل های دستیار دیجیتال خود استفاده می کنند. ما دو سبک را در این زمینه معرفی میکنیم: یک سبک چت برای رباتهای معمولی و محاورهای و یک سبک حرفهایتر برای سناریوهایی مانند دستیارهای دیجیتال داخل خودرو.
مایکروسافت سه سبک احساسی زیر را اعلام می کند:
- بشاش
- همدلانه
- غزلی
گفتار به سبک پخش خبری قبلاً در برنامه تلفن همراه بینگ استفاده شده است، ویدیوی آزمایشی زیر را بررسی کنید.
منبع: مایکروسافت