Funkcja niestandardowego głosu neuronowego firmy Microsoft pozwoli Ci stworzyć bardzo realistyczny, ludzki głos

Ikona czasu czytania 2 minuta. czytać


Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków. Ikona podpowiedzi

Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej

Niestandardowy głos neuronowy firmy Microsoft

Niestandardowy głos neuronowy firmy Microsoft

Firma Microsoft ogłosiła dzisiaj ogólną dostępność niestandardowego głosu neuronowego, funkcji zamiany tekstu na mowę, będącej częścią usługi mowy w usługach poznawczych Azure. Ta funkcja pozwoli Ci stworzyć wysoce realistyczny, ludzki głos dla Twojej aplikacji przy użyciu przełomowych neuronowych modeli zamiany tekstu na mowę. Ponieważ tworzone głosy są tak realistyczne, Microsoft ogranicza dostęp, aby użytkownicy mogli odpowiedzialnie korzystać z tej technologii.

W ramach zaangażowania firmy Microsoft w odpowiedzialną sztuczną inteligencję opracowujemy i wydajemy niestandardowy głos neuronowy z zamiarem ochrony praw jednostek i społeczeństwa, wspierania przejrzystej interakcji człowiek-komputer oraz przeciwdziałania rozprzestrzenianiu się szkodliwych podróbek i wprowadzających w błąd treści. Z tego powodu ograniczyliśmy dostęp i korzystanie z niestandardowego głosu neuronowego.

Aby utworzyć własny głos, wystarczy nagrać dźwięk i przesłać go jako dane treningowe. Usługa Azure Speech Service utworzy unikalny głos dostrojony do Twojego nagrania. Realistycznie i naturalnie brzmiący głos niestandardowego głosu neuronowego może reprezentować marki i pozwalać użytkownikom na konwersacyjną interakcję z aplikacjami w naturalny sposób. Microsoft podkreślił, że następni klienci już korzystają z tej najnowszej funkcji TTS.

  • AT&T/Warner Bros. Niedawno uruchomili pierwsze w swoim rodzaju kreatywne i interaktywne doświadczenie w sklepie AT&T Experience Store w Dallas w Teksasie, gdzie klienci mogą rozmawiać bezpośrednio z Królikiem Bugsem.
  • Progresywny. Korzystając z głosu Flo, kultowego rzecznika Progressive Insurance, firma Progressive stworzyła chatbota Flo, aby usprawnić proces zapytania klientów i zapewnić spersonalizowane doświadczenia.
  • Duolingo. Aby nauka nowego języka była osiągalna i możliwa do zastosowania dzięki dziwacznym postaciom i wysokiej jakości treści, Duolingo stworzyło różnorodną obsadę stylizowanych głosów, korzystając z programu nauczania Duolingo.

Możesz dowiedzieć się więcej o niestandardowym głosie neuronowym tutaj.

Źródło: Microsoft

Więcej na tematy: Niestandardowy głos neuronowy, Microsoft