Η Microsoft θα φέρει την καταστολή θορύβου βασισμένη σε τεχνητή νοημοσύνη στο Microsoft Teams σε πλατφόρμες Mac και φορητές συσκευές

Εικονίδιο ώρας ανάγνωσης 3 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Οι ομάδες της Microsoft

Οι ομάδες της Microsoft

Τον περασμένο μήνα, η Microsoft ανακοίνωσε η κυκλοφορία της δυνατότητας καταστολής θορύβου βασισμένη σε τεχνητή νοημοσύνη φόντου σε πραγματικό χρόνο σε χρήστες επιτραπέζιων υπολογιστών των Windows της Microsoft Teams. Αυτή η λειτουργία μπορεί να καταστείλει τον περιττό θόρυβο, όπως το ανακάτεμα χαρτιών, το χτύπημα των θυρών και το γάβγισμα σκύλων κατά τη διάρκεια μιας κλήσης ομάδας. Η καταστολή θορύβου που βασίζεται σε τεχνητή νοημοσύνη λειτουργεί αναλύοντας την ηχητική τροφοδοσία ενός ατόμου και χρησιμοποιώντας ειδικά εκπαιδευμένα βαθιά νευρωνικά δίκτυα για να φιλτράρει τον θόρυβο και να διατηρεί μόνο το σήμα ομιλίας. Η Microsoft ανακοίνωσε σήμερα ότι εργάζεται για να φέρει την καταστολή θορύβου που βασίζεται σε AI στο Microsoft Teams σε πλατφόρμες Mac και φορητές συσκευές.

Η Microsoft εξήγησε σήμερα επίσης πώς ανέπτυξε αυτήν τη δυνατότητα χωρίς να χρησιμοποιήσει πραγματικά δεδομένα πελατών. Η Microsoft βελτιστοποίησε το μοντέλο βαθιάς εκμάθησης με τρόπο που θα μπορούσε να εκτελείται αποτελεσματικά στον υπολογιστή-πελάτη υπολογιστών Teams σε πραγματικό χρόνο χωρίς πολλά έξοδα.

Για να επιτύχουμε αυτήν την ποικιλομορφία δεδομένων, δημιουργήσαμε ένα μεγάλο σύνολο δεδομένων με περίπου 760 ώρες καθαρών δεδομένων ομιλίας και 180 ωρών δεδομένων θορύβου. Για τη συμμόρφωση με τα αυστηρά πρότυπα απορρήτου της Microsoft, διασφαλίσαμε ότι δεν συλλέγονται δεδομένα πελατών για αυτό το σύνολο δεδομένων. Αντίθετα, χρησιμοποιήσαμε είτε δημόσια διαθέσιμα δεδομένα είτε crowdsourcing για τη συλλογή συγκεκριμένων σεναρίων. Για καθαρή ομιλία, διασφαλίσαμε ότι είχαμε μια ισορροπία γυναικείας και ανδρικής ομιλίας και συλλέξαμε δεδομένα από 10+ γλώσσες που περιλαμβάνουν επίσης τονικές γλώσσες για να διασφαλίσουμε ότι το μοντέλο μας δεν θα αλλάξει το νόημα μιας πρότασης παραμορφώνοντας τον τόνο των λέξεων. Για τα δεδομένα θορύβου συμπεριλάβαμε 150 τύπους θορύβου για να διασφαλίσουμε ότι καλύπτουμε διάφορα σενάρια που μπορεί να αντιμετωπίσουν οι πελάτες μας, από την πληκτρολόγηση του πληκτρολογίου μέχρι το ξέπλυμα της τουαλέτας ή το ροχαλητό. Μια άλλη σημαντική πτυχή ήταν να συμπεριλάβουμε συναισθήματα στην καθαρή ομιλία μας, έτσι ώστε να μην καταστέλλονται εκφράσεις όπως το γέλιο ή το κλάμα. Τα χαρακτηριστικά του περιβάλλοντος από το οποίο οι πελάτες μας συμμετέχουν στις διαδικτυακές τους συναντήσεις Ομάδων έχουν επίσης ισχυρό αντίκτυπο στο σήμα ομιλίας. Για να καταγράψουμε αυτήν την ποικιλομορφία, εκπαιδεύσαμε το μοντέλο μας με δεδομένα από περισσότερα από 3,000 πραγματικά περιβάλλοντα δωματίων και περισσότερα από 115,000 δωμάτια που δημιουργήθηκαν συνθετικά.

Εφόσον χρησιμοποιούμε βαθιά εκμάθηση, είναι σημαντικό να έχουμε μια ισχυρή υποδομή εκπαίδευσης μοντέλου. Χρησιμοποιούμε το Microsoft Azure για να επιτρέψουμε στην ομάδα μας να αναπτύξει βελτιωμένες εκδόσεις του μοντέλου ML μας. Μια άλλη πρόκληση είναι ότι η εξαγωγή πρωτότυπου καθαρού λόγου από τον θόρυβο πρέπει να γίνει με τρόπο που το ανθρώπινο αυτί αντιλαμβάνεται ως φυσικό και ευχάριστο. Δεδομένου ότι δεν υπάρχουν αντικειμενικές μετρήσεις που να συσχετίζονται σε μεγάλο βαθμό με την ανθρώπινη αντίληψη, αναπτύξαμε ένα πλαίσιο που μας επέτρεψε να στείλουμε τα επεξεργασμένα δείγματα ήχου σε προμηθευτές crowdsourcing όπου οι ανθρώπινοι ακροατές βαθμολόγησαν την ποιότητα ήχου τους σε κλίμακα ενός έως πέντε αστέρων για να παράγουν μέσες βαθμολογίες γνώμης (MOS). Με αυτές τις ανθρώπινες αξιολογήσεις μπορέσαμε να αναπτύξουμε μια νέα αντιληπτική μέτρηση που μαζί με τις υποκειμενικές ανθρώπινες αξιολογήσεις μας επέτρεψε να σημειώσουμε γρήγορη πρόοδο στη βελτίωση της ποιότητας των μοντέλων βαθιάς μάθησης.

Δείτε πώς μπορείτε να ενεργοποιήσετε τη λειτουργία καταστολής θορύβου στο Teams:

  1. Επιλέξτε την εικόνα του προφίλ σας επάνω δεξιά στο Teams και, στη συνέχεια, επιλέξτε ρυθμίσεις.
  2. Αγορά Συσκευές στα αριστερά και μετά, κάτω Καταστολή θορύβου, ορίστε μια επιλογή.

  3. Από το παράθυρο της συνάντησης:
    1. Αγορά Περισσότερες επιλογές  στα στοιχεία ελέγχου της σύσκεψής σας και, στη συνέχεια, επιλέξτε Ρυθμίσεις συσκευής.
    2. Κάτω από Καταστολή θορύβου, ορίστε μια επιλογή.

πηγή: Microsoft

Περισσότερα για τα θέματα: microsoft, Οι ομάδες της Microsoft, ομάδες

Αφήστε μια απάντηση

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται *