Come funziona Skype Translator: dietro le quinte (video)

Icona del tempo di lettura 3 minuto. leggere


I lettori aiutano a supportare MSpoweruser. Potremmo ricevere una commissione se acquisti tramite i nostri link. Icona descrizione comando

Leggi la nostra pagina informativa per scoprire come puoi aiutare MSPoweruser a sostenere il team editoriale Per saperne di più

Poche ore fa, Microsoft ha annunciato la prima fase del programma di anteprima di Skype Translator che inizierà con l'inglese e lo spagnolo come prime due lingue. Skype Translator è il prodotto che è il risultato di decenni di ricerca nel riconoscimento vocale, nella traduzione automatizzata e nelle tecnologie generali di apprendimento automatico. Una delle principali tecnologie alla base di Skype Transaltor sono i recenti miglioramenti nel riconoscimento vocale, resi possibili dall'introduzione di reti neurali profonde combinate con la collaudata tecnologia di traduzione automatica statistica di Microsoft, che consentono migliori risultati di traduzione, rendendo possibili conversazioni individuali significative.

Come funziona?

Machine Learning è la capacità di apprendimento del software da esempi di dati di addestramento e Skype Translator è basato su una solida piattaforma di Machine Learning. Imparando dai dati di formazione durante questa fase di anteprima, insieme a tutte le sue sfumature, il software può imparare a riconoscere e tradurre meglio la diversità di argomenti, accenti e variazioni linguistiche degli utenti effettivi di Skype Translator.

I protocolli di apprendimento automatico di Skype Translator addestrano e ottimizzano le attività di riconoscimento vocale (SR) e traduzione automatica (MT), agendo da collante che tiene insieme questi elementi. Questa "colla" trasforma il testo riconosciuto per facilitare la traduzione. Questo processo include la rimozione delle disfluenze (cioè 'ahs' e 'umms' così come le riformulazioni), la divisione del testo in frasi, così come l'aggiunta di punteggiatura e maiuscolo.

I dati di formazione per il riconoscimento vocale e la traduzione automatica provengono da una varietà di fonti, tra cui pagine Web tradotte, video con didascalie e conversazioni individuali tradotte e trascritte in precedenza. Skype Translator registra le conversazioni per analizzare gli script e addestrare il sistema a imparare meglio ogni lingua. Molte persone hanno anche fatto donare dati da conversazioni precedenti, che analizziamo e utilizziamo anche per creare materiale di formazione per i modelli statistici che insegnano ai motori di riconoscimento vocale e traduzione automatica come mappare il flusso audio in ingresso su testo, quindi il testo su un'altra lingua. All'inizio della chiamata, i partecipanti a Skype Translator vengono avvisati chiaramente che la loro conversazione verrà registrata e utilizzata per migliorare la qualità dei servizi di traduzione e riconoscimento vocale di Microsoft.

Dopo che i dati sono stati preparati e inseriti nel sistema di apprendimento automatico, il software di apprendimento automatico crea un modello statistico delle parole in queste conversazioni e del loro contesto. Quando dici qualcosa, il software può trovare qualcosa di simile nel suo modello statistico e applicare la trasformazione precedentemente appresa dall'audio al testo e dal testo alla lingua straniera.

Sebbene il riconoscimento vocale sia stato un importante argomento di ricerca per decenni, l'adozione diffusa della tecnologia è stata ostacolata da elevati tassi di errore e sensibilità alla variazione degli altoparlanti, alle condizioni di rumore ecc. L'avvento delle reti neurali profonde (DNN) per il riconoscimento vocale, sperimentato da Microsoft Ricerca, tassi di errore notevolmente ridotti e maggiore robustezza, consentendo finalmente l'uso di questa tecnologia in contesti ampi come Skype Translator. Allo stesso tempo, il sogno di una comunicazione globale da uomo a uomo è stato un importante fattore motivante e forza trainante per i ricercatori MSR che lavorano su questa tecnologia.

Continua a leggere in dettaglio qui.

via: Skype

Maggiori informazioni sugli argomenti: Dietro le quinte, machine learning, microsoft, riparazioni, skype, traduttore