Microsoft julkistaa useita uusia ominaisuuksia Azure AI:ssä, mukaan lukien tekstistä puheeksi avatar

Lukuajan kuvake 3 min. lukea

Kalenterikuvake Julkaistu Marraskuussa 15, 2023

Julkaistu Marraskuussa 15, 2023

Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta.

Azure AI -palveluiden avulla kehittäjät voivat luoda tekoälysovelluksia valmiilla ja valmiiksi rakennetuilla ja muokattavissa olevilla API:illa ja malleilla. Azure AI -palveluihin kuuluvat Vision-palvelu, puhepalvelu, kääntäjäpalvelu ja paljon muuta. Microsoft julkisti tänään Ignite 2023:ssa useita uusia Azure AI:n ominaisuuksia, mukaan lukien tekstistä puheeksi avatar, henkilökohtainen hermoääni, uusi parannettu konekäännöstila ja paljon muuta. Katso tiedot alta.

Uusi tehtävien optimointi yhteenvetokyky Azure AI Language -kielessä, jota käyttävät suuret kielimallit (GPT-3.5-Turbo, GPT-4, Z-Code++ ja muut).
Uusi konekäännösmalli pystyy kääntämään kielestä toiselle kääntämättä välittäjänä englanniksi. Lisäksi sitä voidaan mukauttaa asiakastietojen avulla, jotta käännökset voidaan mukauttaa paremmin alan kontekstiin.
Nimetty kokonaisuuden tunnistus, asiakirjojen kääntäminen ja tiivistelmät säilöissä antavat valtion virastoille ja teollisuudenaloille, kuten rahoituspalveluille ja terveydenhuollolle, mahdollisuuden käyttää tekoälypalveluja omassa infrastruktuurissaan, ja joilla on tiukat datan asuinpaikkavaatimukset.
Henkilökohtainen ääni, uusi mukautettu hermoääniominaisuus, jonka avulla yritykset voivat luoda mukautettuja hermoääniä 60 sekunnin ääninäytteillä käyttäjilleen. Henkilökohtainen ääni on rajoitetun pääsyn ominaisuus.
Tekstistä puheeksi avatar, uusi tekstistä puheeksi -ominaisuus, joka luo realistisen faksin puhuvasta henkilöstä syöttötekstin ja oikean henkilön puhuvan videodatan perusteella. Sekä valmiiksi rakennetut että mukautetut avatarit ovat nyt esikatselussa, mutta mukautettu avatar on rajoitettu ominaisuus.

Azure AI Vision -palvelu saa seuraavat päivitykset:

Elävyyden toiminnallisuus ja Vision SDK: Elävyystoiminto auttaa estämään kasvojentunnistuksen huijaushyökkäykset ja noudattaa ISO 30107-3 PAD Level 2 -standardia. Vision SDK for Face antaa kehittäjille mahdollisuuden lisätä kasvojentunnistusta ja elävyyttä mobiilisovelluksiin helposti. Molemmat ominaisuudet ovat esikatselussa.
Kuvaanalyysi 4.0: Tämä API esittelee huippuluokan Image Analysis -malleja, jotka kattavat kuvien tekstitykset, OCR:n, objektin tunnistuksen ja paljon muuta. Kaikki ovat käytettävissä yhden, synkronisen API-päätepisteen kautta. Erityisesti parannetussa OCR-mallissa on parannettu tarkkuus sekä kirjoitetussa että käsinkirjoitetussa kuvissa. Kuvaanalyysi 4.0 on yleisesti saatavilla.
Firenzen säätiön malli: Tämä parannettu ominaisuus, joka on koulutettu miljardeilla tekstikuvapareilla ja integroitu kustannustehokkaiksi, tuotantovalmiiksi tietokonenäköpalveluiksi Azure AI Visionissa, antaa kehittäjille mahdollisuuden luoda huippuluokan, markkinavalmiita, vastuullisia tietokonenäkösovelluksia eri toimialoilla. Firenzen säätiömalli on yleisesti saatavilla.

Lopuksi, Azure AI Services -palvelun uudet päivitykset tekevät oivallusten poimimisesta videoista helpompaa kuin koskaan. Voit nyt käyttää Azure AI:tä saadaksesi tekstiyhteenvedon videosisällöstä. Voit myös etsiä nyt etsiä tiettyjä aiheita, hetkiä tai yksityiskohtia laajoissa videoissa luonnollisella kielellä. Katso tiedot alta.

Videosta tekstiksi yhteenveto: Käyttäjät voivat poimia videosisällön olemuksen ja luoda ytimekkäitä ja informatiivisia tekstitiivistelmiä. Kehittynyt algoritmi segmentoi videot yhtenäisiksi luvuiksi hyödyntäen visuaalisia, ääni- ja tekstivihjeitä luodakseen osia, jotka mahtuvat helposti suuriin kielimallien (LLM) kehoteikkunoihin. Jokainen osio sisältää olennaista sisältöä, mukaan lukien tekstit, äänitapahtumat ja visuaaliset elementit. Tämä on ihanteellinen videokoosteiden, koulutusmateriaalien luomiseen tai tiedon jakamiseen.
Tehokas videosisällön haku: Käyttäjät voivat muuntaa videosisällön haettavaksi muotoon LLM:iden ja Video Indexerin oivallusten avulla. Muuntamalla videotiedot LLM-ystävällisiksi kehotteiksi, tärkeimmät kohokohdat ovat käytettävissä tehokkaan haun kannalta. Kohtausten segmentointi, äänitapahtumat ja visuaaliset yksityiskohdat parantavat edelleen sisällön jakautumista, jolloin käyttäjät voivat paikantaa nopeasti tietyt aiheet, hetket tai yksityiskohdat laajoista videoista.

Lisää aiheista: Azure AI, microsoft, tekstistä puheeksi avatar

Pradeep Viswav

Ohjelmisto- ja palveluasiantuntija

Pradeep on tietojenkäsittelytieteen ja tekniikan tutkinnon suorittanut. Hän oli myös Microsoft Student Partner. Tällä hetkellä hän työskentelee johtavassa IT-yrityksessä.