A Microsoft Custom Neural Voice funkciója lehetővé teszi, hogy rendkívül valósághű, emberi hangot hozzon létre

Olvasási idő ikonra 2 perc olvas


Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol. Eszköztipp ikon

Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább

Microsoft egyéni neurális hang

Microsoft egyéni neurális hang

A Microsoft ma bejelentette az Azure Cognitive Services beszédszolgáltatásának részét képező, szövegfelolvasó funkció, a Custom Neural Voice általános elérhetőségét. Ez a funkció lehetővé teszi, hogy a Microsoft úttörő neurális szövegfelolvasó modelljei segítségével rendkívül valósághű, emberszerű egyéni hangot hozzon létre az alkalmazáshoz. Mivel a létrehozott hangok annyira élethűek, a Microsoft korlátozza a hozzáférést, hogy a felhasználók felelősségteljesen használják ezt a technológiát.

A Microsoft felelősségteljes mesterséges intelligencia iránti elkötelezettségének részeként az egyéni és a társadalom jogainak védelme, az ember és a számítógép közötti átlátható interakció elősegítése, valamint a káros mélyhamisítások és a félrevezető tartalmak elterjedésének megakadályozása érdekében az egyéni neurális hangot tervezzük és adjuk ki. Emiatt korlátoztuk a Custom Neural Voice hozzáférését és használatát.

Egyéni hang létrehozásához egyszerűen rögzíthet hangot, és feltöltheti edzésadatként. Az Azure Speech Service egyedi hangot hoz létre a felvételhez hangolva. A Custom Neural Voice valósághű és természetes hangzású hangja képviselheti a márkákat, és lehetővé teszi a felhasználók számára, hogy természetes módon, társalgási módon kommunikáljanak az alkalmazásokkal. A Microsoft kiemelte, hogy a következő ügyfelek már használják ezt a legújabb TTS-funkciót.

  • AT&T/Warner Bros. Nemrég elindították a maga nemében első számú kreatív és interaktív élményt a dallasi AT&T Experience Store-ban, ahol az ügyfelek közvetlenül beszélhetnek Bugs Bunnyval.
  • Haladó. Flo, a Progressive Insurance ikonikus szóvivője hangját felhasználva a Progressive létrehozta a Flo chatbotot, hogy egyszerűsítse az ügyfelek megkeresési folyamatát és személyre szabott élményt nyújtson.
  • Duolingo. Annak érdekében, hogy az új nyelvek elsajátítását elérhetővé és alkalmazhatóvá tegye furcsa karakterekkel és minőségi tartalommal, a Duolingo a Duolingo tantervének felhasználásával stilizált hangok változatos castingját hozta létre.

További információ az egyéni neurális hangról itt.

Forrás: microsoft

Bővebben a témákról: Egyedi neurális hang, microsoft