Η Microsoft Research ξεπερνά το «φράγμα της ανθρώπινης αναγνώρισης ομιλίας»

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Για την τεχνολογία και την έρευνα της Microsoft: Μια ερευνητική ομάδα φωτογραφήθηκε στο Κτήριο 99 της Microsoft στο Ρέντμοντ της Ουάσινγκτον την Πέμπτη, 13 Οκτωβρίου 2016. Φωτογραφία από τον Dan DeLong
Για την τεχνολογία και την έρευνα της Microsoft: Μια ερευνητική ομάδα φωτογραφήθηκε στο Κτήριο 99 της Microsoft στο Ρέντμοντ της Ουάσινγκτον την Πέμπτη, 13 Οκτωβρίου 2016. Φωτογραφία από τον Dan DeLong

Η Microsoft Research έχει κάνει μια σημαντική ανακάλυψη στην αναγνώριση ομιλίας. Τώρα έχουν αναπτύξει ένα σύστημα που κατανοεί μια συνομιλία τόσο καλά όσο ένα άτομο. Το σύστημα αναγνώρισης ομιλίας τους κάνει τα ίδια ή λιγότερα λάθη από τους επαγγελματίες μεταγραφείς. Οι ερευνητές ανέφεραν ποσοστό λεκτικού λάθους (WER) 5.9%, χαμηλότερο από το 6.3% WER που ανέφερε η ομάδα μόλις τον περασμένο μήνα. Είναι το χαμηλότερο που έχει καταγραφεί ποτέ σε σχέση με το πρότυπο της εργασίας αναγνώρισης ομιλίας του Switchboard.

«Φτάσαμε στην ανθρώπινη ισοτιμία», είπε Ξεντεόνγκ Χουάνγκ, επικεφαλής επιστήμονας λόγου της εταιρείας. «Αυτό είναι ένα ιστορικό επίτευγμα».

«Ακόμα και πριν από πέντε χρόνια, δεν θα πίστευα ότι θα μπορούσαμε να το πετύχουμε αυτό. Απλώς δεν θα πίστευα ότι θα ήταν δυνατό», είπε Χάρι Σουμ, ο εκτελεστικός αντιπρόεδρος που ηγείται της ομάδας Τεχνητής Νοημοσύνης και Έρευνας της Microsoft.

«Αυτό το επίτευγμα είναι το αποκορύφωμα είκοσι ετών προσπάθειας», είπε Τζέφρι Τσβάιχ, ο οποίος διευθύνει την ερευνητική ομάδα Speech & Dialog.

Αυτή η πρωτοποριακή έρευνα θα βελτιώσει τις δυνατότητες αναγνώρισης ομιλίας σε διάφορα προϊόντα της Microsoft, συμπεριλαμβανομένων των συσκευών ψυχαγωγίας των καταναλωτών όπως το Xbox, εργαλείων προσβασιμότητας όπως η άμεση μεταγραφή ομιλίας σε κείμενο και προσωπικούς ψηφιακούς βοηθούς όπως η Cortana.

«Αυτό θα κάνει την Cortana πιο ισχυρή, καθιστώντας δυνατό έναν πραγματικά έξυπνο βοηθό», είπε ο Shum.

Διαβάστε την πλήρη ιστορία εδώ.

Περισσότερα για τα θέματα: Θεαματική, microsoft, Τεχνολογία της Microsoft, Έρευνα, αναγνώρισης ομιλίας

Αφήστε μια απάντηση

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται *