Η Microsoft Research ξεπερνά το «φράγμα της ανθρώπινης αναγνώρισης ομιλίας»

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση

Εικονίδιο ημερολογίου Δημοσιεύθηκε στις Οκτώβριος 18, 2016

Δημοσιεύθηκε στις Οκτώβριος 18, 2016

Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας.

Για την τεχνολογία και την έρευνα της Microsoft: Μια ερευνητική ομάδα φωτογραφήθηκε στο Κτήριο 99 της Microsoft στο Ρέντμοντ της Ουάσινγκτον την Πέμπτη, 13 Οκτωβρίου 2016. Φωτογραφία από τον Dan DeLong

Η Microsoft Research έχει κάνει μια σημαντική ανακάλυψη στην αναγνώριση ομιλίας. Τώρα έχουν αναπτύξει ένα σύστημα που κατανοεί μια συνομιλία τόσο καλά όσο ένα άτομο. Το σύστημα αναγνώρισης ομιλίας τους κάνει τα ίδια ή λιγότερα λάθη από τους επαγγελματίες μεταγραφείς. Οι ερευνητές ανέφεραν ποσοστό λεκτικού λάθους (WER) 5.9%, χαμηλότερο από το 6.3% WER που ανέφερε η ομάδα μόλις τον περασμένο μήνα. Είναι το χαμηλότερο που έχει καταγραφεί ποτέ σε σχέση με το πρότυπο της εργασίας αναγνώρισης ομιλίας του Switchboard.

«Φτάσαμε στην ανθρώπινη ισοτιμία», είπε Ξεντεόνγκ Χουάνγκ, επικεφαλής επιστήμονας λόγου της εταιρείας. «Αυτό είναι ένα ιστορικό επίτευγμα».

«Ακόμα και πριν από πέντε χρόνια, δεν θα πίστευα ότι θα μπορούσαμε να το πετύχουμε αυτό. Απλώς δεν θα πίστευα ότι θα ήταν δυνατό», είπε Χάρι Σουμ, ο εκτελεστικός αντιπρόεδρος που ηγείται της ομάδας Τεχνητής Νοημοσύνης και Έρευνας της Microsoft.

«Αυτό το επίτευγμα είναι το αποκορύφωμα είκοσι ετών προσπάθειας», είπε Τζέφρι Τσβάιχ, ο οποίος διευθύνει την ερευνητική ομάδα Speech & Dialog.

Αυτή η πρωτοποριακή έρευνα θα βελτιώσει τις δυνατότητες αναγνώρισης ομιλίας σε διάφορα προϊόντα της Microsoft, συμπεριλαμβανομένων των συσκευών ψυχαγωγίας των καταναλωτών όπως το Xbox, εργαλείων προσβασιμότητας όπως η άμεση μεταγραφή ομιλίας σε κείμενο και προσωπικούς ψηφιακούς βοηθούς όπως η Cortana.

«Αυτό θα κάνει την Cortana πιο ισχυρή, καθιστώντας δυνατό έναν πραγματικά έξυπνο βοηθό», είπε ο Shum.

Διαβάστε την πλήρη ιστορία εδώ.

Περισσότερα για τα θέματα: Θεαματική, microsoft, Τεχνολογία της Microsoft, Έρευνα, αναγνώρισης ομιλίας

Pradeep Viswav

Ειδικός Λογισμικού και Υπηρεσιών

Ο Pradeep είναι Πτυχιούχος Επιστήμης Υπολογιστών και Μηχανικών Υπολογιστών. Ήταν επίσης φοιτητής της Microsoft. Αυτή τη στιγμή εργάζεται σε κορυφαία εταιρεία πληροφορικής.

Αφήστε μια απάντηση