OpenAI Whisper -malli on nyt saatavilla Microsoftin Azure OpenAI -palvelussa ja Azure AI Speech -palvelussa

2 min. lukea

Julkaistu Syyskuu 18, 2023

Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta.

Microsoft OpenAI -palvelu OpenAI Whisper

Takaisin heinäkuussa, Microsoft ilmoitti että OpenAI Whisper -malli tulee pian Azure OpenAI Servicesille. Viime perjantaina Microsoft ilmoitti, että OpenAI Whisper -malli on nyt saatavilla Azure OpenAI -palvelua ja Azure AI Speech -palvelua käyttäville asiakkaille.

OpenAI whisper -malli on hermoverkko, joka pystyy suorittamaan puheentunnistus- ja käännöstehtäviä 57 kielellä. Se on koulutettu laajaan ja monipuoliseen verkosta kerättyyn ääni- ja tekstitietosarjaan. Se käyttää yksinkertaista päästä päähän -lähestymistapaa, joka perustuu Transformer-enkooderi-dekooderiarkkitehtuuriin, ja se voi tuottaa transkriptioita, joissa on parannettu luettavuus ja lausetason aikaleimat.

Yritykset voivat nyt rakentaa OpenAI Whisper -malliin perustuvia sovelluksia seuraavilla kahdella tavalla:

OpenAI Whisper -malli Azure OpenAI -palvelussa:

OpenAI tarjoaa jo Whisper API:n yksinään. Käyttämällä tätä uutta Azure OpenAI -palvelua kehittäjät voivat käyttää samaa OpenAI Whisper API:ta ominaisuuksissa ja toiminnoissa, mukaan lukien transkriptio- ja käännösominaisuudet. Whisper-mallin REST-sovellusliittymät transkriptiota ja kääntämistä varten löytyvät Azure OpenAI Service -portaalista.

OpenAI Whisper -malli Azure AI Speechissä:

Azure AI Speechin käyttäjät voivat nyt käyttää uutta OpenAI:n Whisper-mallia yhdessä olemassa olevan Azure AI Speech -erätranskription API:n kanssa. Whisper in Azure AI Speech -käyttäjät hyötyvät olemassa olevista ominaisuuksista, kuten asynkronisesta käsittelystä, kaiuttimien päiväkirjasta, mukauttamisesta ja suuremmista tiedostokooista. Etsi tiedot alta.

Suuret tiedostokoot: Azure AI Speech parantaa Whisper-transkriptiota mahdollistamalla jopa 1 Gt:n kokoiset tiedostot ja mahdollisuuden käsitellä suuria tiedostomääriä mahdollistamalla jopa 1000 XNUMX tiedoston yhdistämisen yhdellä pyynnöllä.
Aikaleimat: Azure AI Speechin avulla tunnistustulos sisältää sanatason aikaleimat, joiden avulla voidaan tunnistaa, missä äänessä kukin sana puhutaan.
Puhujan päiväkirja: Tämä on toinen Azure AI Speechin hyödyllinen ominaisuus, joka tunnistaa yksittäiset kaiuttimet äänitiedostossa ja merkitsee niiden puhesegmentit. Tämän ominaisuuden avulla asiakkaat voivat erottaa puhujat toisistaan, litteroida sanansa tarkasti ja luoda järjestelmällisemmän ja jäsennellymmän äänitiedostojen transkription.
Räätälöinti/hienosäätö (saatavilla pian): Azure Speechin mukautetun puheen avulla asiakkaat voivat hienosäätää Whisperin omia tietojaan tunnistamisen tarkkuuden ja johdonmukaisuuden parantamiseksi.

Lisää aiheista: microsoft

Pradeep Viswav

Ohjelmisto- ja palveluasiantuntija

Pradeep on tietojenkäsittelytieteen ja tekniikan tutkinnon suorittanut. Hän oli myös Microsoft Student Partner. Tällä hetkellä hän työskentelee johtavassa IT-yrityksessä.