سرویس متن به گفتار Microsoft Azure اکنون سبک‌های صوتی و احساسی با صدای طبیعی را ارائه می‌دهد

نماد زمان خواندن 2 دقیقه خواندن


خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم. نماد راهنمای ابزار

صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب

مایکروسافت لاورو

سرویس متن به گفتار مایکروسافت خدمات شناختی، متن را به گفتار برای رابط های طبیعی تر تبدیل می کند. توسعه دهندگان می توانند از این سرویس برای ساخت برنامه ها و سرویس هایی که به طور طبیعی صحبت می کنند استفاده کنند. به لطف تحقیقات پیشرفت در فناوری سنتز گفتار، سرویس متن به گفتار مایکروسافت در حال حاضر گفتاری روان و با صدای طبیعی ارائه می دهد که با الگوهای استرس و آهنگ صدای انسان مطابقت دارد. امروز، مایکروسافت سه سبک صوتی جدید و سبک های احساسی را معرفی کرد که به توسعه دهندگان امکان انتخاب بیشتر در انتخاب سبک گفتار برای برنامه هایشان را می دهد.

مایکروسافت سه سبک صوتی زیر را اعلام می کند:

  • پخش خبری - با صدای عصبی TTS در سبک پخش خبری، کاربران شما می توانند از گوش دادن به اخبار یا مقالات با لحنی حرفه ای لذت ببرند که منعکس کننده آنچه ممکن است در برنامه های خبری تلویزیونی یا رادیویی بشنوید.
  • خدمات مشتری – سبک خدمات مشتری دارای لحنی دوستانه و جذاب است و برای سناریوهایی که شامل پشتیبانی مشتری می‌شود، مانند ورود فردی به پرواز، رزرو رستوران، یا گزارش ادعا، مناسب است.
  • دستیار دیجیتال - بسیاری از مشتریان از صدای TTS عصبی برای راه حل های دستیار دیجیتال خود استفاده می کنند. ما دو سبک را در این زمینه معرفی می‌کنیم: یک سبک چت برای ربات‌های معمولی و محاوره‌ای و یک سبک حرفه‌ای‌تر برای سناریوهایی مانند دستیارهای دیجیتال داخل خودرو.

مایکروسافت سه سبک احساسی زیر را اعلام می کند:

  • بشاش
  • همدلانه
  • غزلی

گفتار به سبک پخش خبری قبلاً در برنامه تلفن همراه بینگ استفاده شده است، ویدیوی آزمایشی زیر را بررسی کنید.

منبع: مایکروسافت

بیشتر در مورد موضوعات: سبک های احساسی, مایکروسافت لاورو, متن به گفتار, سبک های صوتی

پاسخ دهید

آدرس ایمیل شما منتشر نخواهد شد. بخشهای موردنیاز علامتگذاری شدهاند *