OpenAI Whisper -malli on nyt saatavilla Microsoftin Azure OpenAI -palvelussa ja Azure AI Speech -palvelussa

Lukuajan kuvake 2 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Microsoft OpenAI -palvelu OpenAI Whisper

Takaisin heinäkuussa, Microsoft ilmoitti että OpenAI Whisper -malli tulee pian Azure OpenAI Servicesille. Viime perjantaina Microsoft ilmoitti, että OpenAI Whisper -malli on nyt saatavilla Azure OpenAI -palvelua ja Azure AI Speech -palvelua käyttäville asiakkaille.

OpenAI whisper -malli on hermoverkko, joka pystyy suorittamaan puheentunnistus- ja käännöstehtäviä 57 kielellä. Se on koulutettu laajaan ja monipuoliseen verkosta kerättyyn ääni- ja tekstitietosarjaan. Se käyttää yksinkertaista päästä päähän -lähestymistapaa, joka perustuu Transformer-enkooderi-dekooderiarkkitehtuuriin, ja se voi tuottaa transkriptioita, joissa on parannettu luettavuus ja lausetason aikaleimat.

Yritykset voivat nyt rakentaa OpenAI Whisper -malliin perustuvia sovelluksia seuraavilla kahdella tavalla:

OpenAI Whisper -malli Azure OpenAI -palvelussa:

OpenAI tarjoaa jo Whisper API:n yksinään. Käyttämällä tätä uutta Azure OpenAI -palvelua kehittäjät voivat käyttää samaa OpenAI Whisper API:ta ominaisuuksissa ja toiminnoissa, mukaan lukien transkriptio- ja käännösominaisuudet. Whisper-mallin REST-sovellusliittymät transkriptiota ja kääntämistä varten löytyvät Azure OpenAI Service -portaalista.

OpenAI Whisper -malli Azure AI Speechissä:

Azure AI Speechin käyttäjät voivat nyt käyttää uutta OpenAI:n Whisper-mallia yhdessä olemassa olevan Azure AI Speech -erätranskription API:n kanssa. Whisper in Azure AI Speech -käyttäjät hyötyvät olemassa olevista ominaisuuksista, kuten asynkronisesta käsittelystä, kaiuttimien päiväkirjasta, mukauttamisesta ja suuremmista tiedostokooista. Etsi tiedot alta.

  • Suuret tiedostokoot: Azure AI Speech parantaa Whisper-transkriptiota mahdollistamalla jopa 1 Gt:n kokoiset tiedostot ja mahdollisuuden käsitellä suuria tiedostomääriä mahdollistamalla jopa 1000 XNUMX tiedoston yhdistämisen yhdellä pyynnöllä.
  • Aikaleimat: Azure AI Speechin avulla tunnistustulos sisältää sanatason aikaleimat, joiden avulla voidaan tunnistaa, missä äänessä kukin sana puhutaan.
  • Puhujan päiväkirja: Tämä on toinen Azure AI Speechin hyödyllinen ominaisuus, joka tunnistaa yksittäiset kaiuttimet äänitiedostossa ja merkitsee niiden puhesegmentit. Tämän ominaisuuden avulla asiakkaat voivat erottaa puhujat toisistaan, litteroida sanansa tarkasti ja luoda järjestelmällisemmän ja jäsennellymmän äänitiedostojen transkription.
  • Räätälöinti/hienosäätö (saatavilla pian): Azure Speechin mukautetun puheen avulla asiakkaat voivat hienosäätää Whisperin omia tietojaan tunnistamisen tarkkuuden ja johdonmukaisuuden parantamiseksi.

Lisää aiheista: Azure OpenAI -palvelu, microsoft, OpenAI Whisper

Jätä vastaus

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *