Il servizio di sintesi vocale di Microsoft Azure ora offre stili vocali ed emozionali dal suono naturale
2 minuto. leggere
Edizione del
Leggi la nostra pagina informativa per scoprire come puoi aiutare MSPoweruser a sostenere il team editoriale Per saperne di più
Il servizio Sintesi vocale di Microsoft Cognitive Services converte il testo in sintesi vocale per interfacce più naturali. Gli sviluppatori possono utilizzare questo servizio per creare app e servizi che parlano in modo naturale. Grazie alla ricerca rivoluzionaria nella tecnologia di sintesi vocale, il servizio Text to Speech di Microsoft offre già un parlato fluido e naturale che corrisponde ai modelli di stress e all'intonazione delle voci umane. Oggi Microsoft ha annunciato tre nuovi stili vocali e stili di emozioni che offrono agli sviluppatori una scelta più ampia nella selezione dello stile vocale per le loro applicazioni.
Microsoft annuncia i seguenti tre stili vocali:
- Telegiornale: con le voci neurali TTS nello stile del telegiornale, i tuoi utenti possono divertirsi ascoltando notizie o articoli con un tono professionale che riflette ciò che potresti sentire nei notiziari TV o radiofonici.
- Servizio clienti: lo stile del servizio clienti presenta un tono amichevole e coinvolgente ed è adatto a scenari che coinvolgono l'assistenza clienti, come un individuo che effettua il check-in sul proprio volo, effettua una prenotazione al ristorante o segnala un sinistro.
- Assistente digitale: molti clienti hanno utilizzato le voci TTS neurali per le loro soluzioni di assistente digitale. Stiamo introducendo due stili in quest'area: uno stile di chat per robot più casuali e conversazionali e uno stile più professionale per scenari come gli assistenti digitali in auto.
Microsoft annuncia i seguenti tre stili di emozione:
- Allegro
- Empatico
- Lirico
Il discorso in stile telegiornale è già utilizzato nell'app mobile Bing, guarda il video dimostrativo di seguito.
Fonte: Microsoft