Tính năng Custom Neural Voice của Microsoft sẽ cho phép bạn tạo ra giọng nói giống con người, có độ chân thực cao

Biểu tượng thời gian đọc 2 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Giọng nói thần kinh tùy chỉnh của Microsoft

Giọng nói thần kinh tùy chỉnh của Microsoft

Microsoft hôm nay đã công bố tính khả dụng chung của Giọng nói thần kinh tùy chỉnh, một tính năng Chuyển văn bản thành giọng nói, một phần của Dịch vụ giọng nói trong Dịch vụ nhận thức Azure. Tính năng này sẽ cho phép bạn tạo ra một giọng nói tùy chỉnh có độ chân thực cao, giống như con người cho ứng dụng của bạn bằng cách sử dụng các mô hình chuyển văn bản thành giọng nói thần kinh đột phá của Microsoft. Vì giọng nói được tạo ra rất giống thật, Microsoft đang giới hạn quyền truy cập để người dùng sử dụng công nghệ này một cách có trách nhiệm.

Là một phần trong cam kết của Microsoft đối với AI có trách nhiệm, chúng tôi đang thiết kế và phát hành Giọng nói thần kinh tùy chỉnh với mục đích bảo vệ quyền của cá nhân và xã hội, thúc đẩy sự tương tác giữa người và máy tính minh bạch và chống lại sự gia tăng của các nội dung sai lệch và sâu sắc có hại. Vì lý do này, chúng tôi đã hạn chế quyền truy cập và sử dụng Giọng nói thần kinh tùy chỉnh.

Để tạo giọng nói tùy chỉnh, bạn có thể ghi lại âm thanh và tải lên làm dữ liệu đào tạo. Dịch vụ giọng nói Azure sẽ tạo ra một giọng nói duy nhất được điều chỉnh cho bản ghi âm của bạn. Giọng nói chân thực và tự nhiên của giọng nói thần kinh tùy chỉnh có thể đại diện cho thương hiệu và cho phép người dùng tương tác với các ứng dụng một cách tự nhiên. Microsoft nhấn mạnh rằng những khách hàng sau đã sử dụng tính năng TTS mới nhất này.

  • AT & T / Warner Bros. Gần đây, họ đã ra mắt trải nghiệm tương tác và sáng tạo đầu tiên tại AT&T Experience Store ở Dallas, TX, nơi khách hàng có thể nói chuyện trực tiếp với Bugs Bunny.
  • Cấp tiến. Sử dụng tiếng nói của Flo, người phát ngôn mang tính biểu tượng của Bảo hiểm lũy tiến, Progressive đã tạo ra chatbot Flo để hợp lý hóa quy trình yêu cầu của khách hàng và mang lại trải nghiệm được cá nhân hóa.
  • Duolingo Để giúp việc học một ngôn ngữ mới cảm thấy có thể đạt được và áp dụng được với các ký tự kỳ quặc và nội dung chất lượng, Duolingo đã tạo ra một loạt các giọng nói cách điệu bằng cách sử dụng chương trình giảng dạy Duolingo.

Bạn có thể tìm hiểu thêm về Giọng nói thần kinh tùy chỉnh tại đây.

nguồn: microsoft

Thông tin thêm về các chủ đề: Giọng nói thần kinh tùy chỉnh, microsoft