Jak funguje Skype Translator: Behind The Scenes (Video)

Ikona času čtení 3 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více

Před několika hodinami Microsoft oznámil první fázi zkušebního programu Skype Translator, který začne s angličtinou a španělštinou jako prvními dvěma jazyky. Skype Translator je produkt, který je výsledkem desetiletí výzkumu v oblasti rozpoznávání řeči, automatického překladu a obecných technologií strojového učení. Jednou z hlavních technologií stojících za Skype Transaltorem je nedávná vylepšení v rozpoznávání řeči, která byla umožněna zavedením hlubokých neuronových sítí v kombinaci s osvědčenou technologií statistického strojového překladu společnosti Microsoft, což umožňuje lepší výsledky překladu a umožňuje smysluplnou konverzaci jeden na jednoho.

Jak to funguje?

Machine Learning je schopnost softwarového učení z příkladů školicích dat a Skype Translator je postaven na robustní platformě Machine Learning. Učením se ze školicích dat během této fáze náhledu spolu se všemi jejich nuancemi se software může naučit lépe rozpoznávat a překládat rozmanitost témat, přízvuků a jazykových variací skutečných uživatelů Skype Translator.

Protokoly strojového učení Skype Translator trénují a optimalizují úlohy rozpoznávání řeči (SR) a automatického strojového překladu (MT) a fungují jako lepidlo, které drží tyto prvky pohromadě. Toto „lepidlo“ transformuje rozpoznaný text pro usnadnění překladu. Tento proces zahrnuje odstranění disfluences (tj. 'ahs' a 'umms' a také přeformulování), rozdělení textu do vět, stejně jako přidání interpunkce a velkých písmen.

Tréninková data pro rozpoznávání řeči a strojový překlad pocházejí z různých zdrojů, včetně přeložených webových stránek, videí s titulky a také dříve přeložených a přepsaných konverzací jeden na jednoho. Skype Translator zaznamenává konverzace, aby analyzoval skripty a trénoval systém, aby se lépe naučil každý jazyk. Mnoho lidí nám také darovalo data z předchozích konverzací, která také analyzujeme a používáme k vytvoření výukového materiálu pro statistické modely, které učí motory rozpoznávání řeči a strojového překladu, jak mapovat příchozí audio stream na text a poté text na jiný jazyk. Účastníci Skype Translator jsou na začátku hovoru jasně upozorněni, že jejich konverzace bude nahrána a použita ke zlepšení kvality překladatelských služeb a služeb rozpoznávání hlasu společnosti Microsoft.

Poté, co jsou data připravena a vložena do systému strojového učení, software strojového učení sestaví statistický model slov v těchto konverzacích a jejich kontextu. Když něco řeknete, software může najít něco podobného ve svém statistickém modelu a aplikovat dříve naučenou transformaci ze zvuku na text az textu do cizího jazyka.

Zatímco rozpoznávání řeči bylo důležitým výzkumným tématem po celá desetiletí, široké přijetí technologie bylo zmařeno vysokou chybovostí a citlivostí na změny reproduktorů, hlukové podmínky atd. Nástup Deep Neural Networks (DNN) pro rozpoznávání řeči, propagovaný společností Microsoft Výzkum, dramaticky snížená chybovost a zlepšená robustnost, což konečně umožňuje použití této technologie v širokých kontextech, jako je Skype Translator. Sen o globální komunikaci mezi lidmi byl zároveň hlavním motivačním faktorem a hnací silou pro výzkumníky MSR pracující na této technologii.

Pokračujte ve čtení o tom podrobně zde.

přes: Skype

Více o tématech: V zákulisí, strojové učení, microsoft, výzkum, skype, překladatel