Microsoft arată revoluții în tehnologia de traducere a vorbirii
2 min. citit
Publicat în data de
Citiți pagina noastră de dezvăluire pentru a afla cum puteți ajuta MSPoweruser să susțină echipa editorială Află mai multe
Rick Rashid, Chief Research Officer al Microsoft a dat o demonstrație la Tianjin, China, la evenimentul Microsoft Research Asia 21st Century Computing. El a discutat despre recunoașterea vorbirii în computer și despre descoperirea recentă pe care Microsoft o are în ea.
Până de curând, chiar și cele mai bune sisteme de vorbire încă aveau rate de eroare a cuvintelor de 20-25% la vorbirea arbitrară.
Cu puțin peste doi ani în urmă, cercetătorii de la Microsoft Research și de la Universitatea din Toronto au făcut o nouă descoperire. Folosind o tehnică numită Rețele neuronale profunde, care este modelată după comportamentul creierului uman, cercetătorii au reușit să antreneze recunoașteri de vorbire mai discriminatori și mai buni decât metodele anterioare.
În timpul prezentării mele din 25 octombrie în China, am avut ocazia să prezint cele mai recente rezultate ale acestei lucrări. Am reușit să reducem rata de eroare a cuvintelor pentru vorbire cu peste 30% în comparație cu metodele anterioare. Aceasta înseamnă că, în loc să existe un cuvânt din 4 sau 5 incorect, acum rata de eroare este de un cuvânt din 7 sau 8. Deși încă departe de a fi perfectă, aceasta este cea mai dramatică schimbare în acuratețe de la introducerea modelării ascunse Markov în 1979, și pe măsură ce adăugăm mai multe date la antrenament credem că vom obține rezultate și mai bune.
Mai târziu, a făcut o demonstrație live a rezultatelor la care lucrează, traducând tot ce a vorbit în engleză în chineză în câteva secunde. Urmărește videoclipul de mai sus pentru a vedea magia!
prin intermediul: Următorul la Microsoft