Функция Custom Neural Voice от Microsoft позволит вам создать очень реалистичный человеческий голос.

Значок времени чтения 2 минута. читать


Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам. Значок подсказки

Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее

Пользовательский нейронный голос Microsoft

Пользовательский нейронный голос Microsoft

Сегодня Microsoft объявила об общедоступной функции Custom Neural Voice, функции преобразования текста в речь, входящей в состав службы распознавания речи в Azure Cognitive Services. Эта функция позволит вам создать очень реалистичный, похожий на человеческий голос для вашего приложения, используя новаторские нейронные модели преобразования текста в речь от Microsoft. Поскольку созданные голоса настолько реалистичны, Microsoft ограничивает доступ, чтобы пользователи ответственно относились к использованию этой технологии.

В рамках приверженности Microsoft ответственному ИИ мы разрабатываем и выпускаем Custom Neural Voice с намерением защитить права людей и общества, способствовать прозрачному взаимодействию человека и компьютера и противодействовать распространению вредоносных дипфейков и вводящего в заблуждение контента. По этой причине мы ограничили доступ и использование Custom Neural Voice.

Чтобы создать собственный голос, вы можете просто записать звук и загрузить его в качестве обучающих данных. Служба распознавания речи Azure создаст уникальный голос, настроенный для вашей записи. Реалистичный и естественный голос Custom Neural Voice может представлять бренды и позволяет пользователям взаимодействовать с приложениями естественным образом. Microsoft подчеркнула, что следующие клиенты уже используют эту последнюю функцию TTS.

  • AT&T/Warner Bros. Недавно они запустили первый в своем роде творческий и интерактивный опыт в магазине AT&T Experience Store в Далласе, штат Техас, где клиенты могут напрямую общаться с Багзом Банни.
  • Прогрессивный. Используя голос Фло, культового представителя Progressive Insurance, компания Progressive создала чат-бота Flo, чтобы упростить процесс обработки запросов клиентов и предоставить персонализированный опыт.
  • Duolingo. Чтобы сделать изучение нового языка доступным и применимым благодаря причудливым персонажам и качественному контенту, Duolingo создала разнообразный набор стилизованных голосов, используя учебную программу Duolingo.

Вы можете узнать больше о Custom Neural Voice здесь.

Источник: Microsoft

Подробнее о темах: Пользовательский нейронный голос, Microsoft