Microsoft przygotowuje się do udostępnienia usługi Speech to Text AI Cognitive dla programistów
2 minuta. czytać
Opublikowany
Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej
Jeśli chcesz stworzyć własną wersję Amazon Echo, możesz poświęcić dużo czasu na rozwijanie własnego silnika rozpoznawania głosu lub możesz skorzystać z nowych usług poznawczych firmy Microsoft, które firma Microsoft przygotowuje teraz do udostępnienia programistom.
Microsoft przygotowuje się do udostępnienia programistom usługi Custom Speech Service, Content Moderator i Bing Speech API, 3 z 25 narzędzi usług kognitywnych, które firma Microsoft ostatecznie udostępni.
Narzędzie Custom Speech Service stosuje mechanizm zamiany mowy na tekst firmy Microsoft do danych dostarczonych przez programistów, a firma Microsoft dostroiła swoje algorytmy rozpoznawania mowy tak, aby działały w dobrze zaszumionych obszarach z użyciem żargonu, dialogów i akcentów.
Content Moderator umożliwia użytkownikom poddawanie kwarantannie i przeglądanie obrazów, danych tekstowych i wideo przed opublikowaniem, podczas gdy interfejs API Bing Speech konwertuje dźwięk na tekst i konwertuje tekst z powrotem na mowę.
Usługi działają dobrze z Microsoft Bot Framework, ale mogą być również używane niezależnie i umożliwiają programistom łatwe dodawanie funkcji do swoich aplikacji.
Narzędzie Custom Speech Service jest już dostępne w wersji zapoznawczej, natomiast moderator treści i interfejs Bing Speech API będą ogólnie dostępne w marcu 2017 r.
Ponad 424,000 60 programistów w XNUMX krajach wypróbowało już usługi Cognitive firmy Microsoft i widzieliśmy już, jak technologia została zastosowana w urządzeniu w stylu Alexa w postaci powyżej Mattel Arystoteles.
Przeczytaj więcej o korzystaniu z tych usług w Microsoft tutaj.