Η Microsoft Research ξεπερνά το «φράγμα της ανθρώπινης αναγνώρισης ομιλίας»
2 λεπτό. ανάγνωση
Δημοσιεύθηκε στις
Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα
Η Microsoft Research έχει κάνει μια σημαντική ανακάλυψη στην αναγνώριση ομιλίας. Τώρα έχουν αναπτύξει ένα σύστημα που κατανοεί μια συνομιλία τόσο καλά όσο ένα άτομο. Το σύστημα αναγνώρισης ομιλίας τους κάνει τα ίδια ή λιγότερα λάθη από τους επαγγελματίες μεταγραφείς. Οι ερευνητές ανέφεραν ποσοστό λεκτικού λάθους (WER) 5.9%, χαμηλότερο από το 6.3% WER που ανέφερε η ομάδα μόλις τον περασμένο μήνα. Είναι το χαμηλότερο που έχει καταγραφεί ποτέ σε σχέση με το πρότυπο της εργασίας αναγνώρισης ομιλίας του Switchboard.
«Φτάσαμε στην ανθρώπινη ισοτιμία», είπε Ξεντεόνγκ Χουάνγκ, επικεφαλής επιστήμονας λόγου της εταιρείας. «Αυτό είναι ένα ιστορικό επίτευγμα».
«Ακόμα και πριν από πέντε χρόνια, δεν θα πίστευα ότι θα μπορούσαμε να το πετύχουμε αυτό. Απλώς δεν θα πίστευα ότι θα ήταν δυνατό», είπε Χάρι Σουμ, ο εκτελεστικός αντιπρόεδρος που ηγείται της ομάδας Τεχνητής Νοημοσύνης και Έρευνας της Microsoft.
«Αυτό το επίτευγμα είναι το αποκορύφωμα είκοσι ετών προσπάθειας», είπε Τζέφρι Τσβάιχ, ο οποίος διευθύνει την ερευνητική ομάδα Speech & Dialog.
Αυτή η πρωτοποριακή έρευνα θα βελτιώσει τις δυνατότητες αναγνώρισης ομιλίας σε διάφορα προϊόντα της Microsoft, συμπεριλαμβανομένων των συσκευών ψυχαγωγίας των καταναλωτών όπως το Xbox, εργαλείων προσβασιμότητας όπως η άμεση μεταγραφή ομιλίας σε κείμενο και προσωπικούς ψηφιακούς βοηθούς όπως η Cortana.
«Αυτό θα κάνει την Cortana πιο ισχυρή, καθιστώντας δυνατό έναν πραγματικά έξυπνο βοηθό», είπε ο Shum.
Διαβάστε την πλήρη ιστορία εδώ.