Microsoft vil bringe AI-basert støydemping til Microsoft Teams på Mac og mobile plattformer

Ikon for lesetid 3 min. lese


Lesere hjelper til med å støtte MSpoweruser. Vi kan få provisjon hvis du kjøper gjennom lenkene våre. Verktøytipsikon

Les vår avsløringsside for å finne ut hvordan du kan hjelpe MSPoweruser opprettholde redaksjonen Les mer

Microsoft-lag

Microsoft-lag

Forrige måned, Microsoft annonsert utrullingen av sanntids bakgrunns-AI-basert støydempingsfunksjon til Microsoft Teams Windows-skrivebordsbrukere. Denne funksjonen kan undertrykke unødvendig støy som stokking av papirer, smelling av dører og bjeffende hunder under en Teams-samtale. AI-basert støyundertrykkelse fungerer ved å analysere en persons lydinnmating og bruke spesialtrente dype nevrale nettverk for å filtrere ut støyen og bare beholde talesignalet. Microsoft kunngjorde i dag at de jobber med å bringe AI-basert støydemping til Microsoft Teams på Mac og mobile plattformer.

Microsoft forklarte i dag også hvordan de utviklet denne funksjonen uten å bruke faktiske kundedata. Microsoft optimaliserte dyplæringsmodellen på en måte som kunne kjøres effektivt på Teams skrivebordsklient i sanntid uten mye overhead.

For å oppnå dette datasettmangfoldet har vi laget et stort datasett med omtrent 760 timer med rene taledata og 180 timer med støydata. For å overholde Microsofts strenge personvernstandarder har vi sørget for at det ikke samles inn kundedata for dette datasettet. I stedet brukte vi enten offentlig tilgjengelige data eller crowddsourcing for å samle inn spesifikke scenarier. For ren tale sørget vi for at vi hadde en balanse mellom kvinnelig og mannlig tale, og vi samlet inn data fra 10+ språk som også inkluderer tonale språk for å sikre at modellen vår ikke vil endre betydningen av en setning ved å forvrenge tonen i ordene. For støydataene inkluderte vi 150 støytyper for å sikre at vi dekker ulike scenarier som kundene våre kan støte på, fra tastaturtasting til toalettspyling eller snorking. Et annet viktig aspekt var å inkludere følelser i vår rene tale slik at uttrykk som latter eller gråt ikke undertrykkes. Egenskapene til miljøet der kundene våre blir med på deres online Teams-møter, har også en sterk innvirkning på talesignalet. For å fange det mangfoldet trente vi modellen vår med data fra mer enn 3,000 115,000 ekte rommiljøer og mer enn XNUMX XNUMX syntetiske rom.

Siden vi bruker dyp læring er det viktig å ha en kraftig modell for opplæringsinfrastruktur. Vi bruker Microsoft Azure for å la teamet vårt utvikle forbedrede versjoner av ML-modellen vår. En annen utfordring er at utvinningen av original ren tale fra støyen må gjøres på en måte som det menneskelige øret opplever som naturlig og behagelig. Siden det ikke er noen objektive beregninger som er sterkt korrelert til menneskelig oppfatning, utviklet vi et rammeverk som gjorde det mulig for oss å sende de behandlede lydprøvene til crowdsourcing-leverandører der menneskelige lyttere vurderte lydkvaliteten deres på en skala fra én til fem stjerner for å gi gjennomsnittlige meningspoeng. (MOS). Med disse menneskelige vurderingene var vi i stand til å utvikle en ny perseptuell metrikk som sammen med de subjektive menneskelige vurderingene tillot oss å gjøre raske fremskritt med å forbedre kvaliteten på våre dyplæringsmodeller.

Slik kan du aktivere støydempingsfunksjonen i Teams:

  1. Velg profilbildet ditt øverst til høyre i Teams og velg deretter innstillinger.
  2. Plukke ut Enheter til venstre og deretter under Lyddemping, Velg et alternativ.

  3. Fra møtevinduet:
    1. Plukke ut Flere valg  i møtekontrollene og velg deretter Enhetsinnstillinger.
    2. Under Lyddemping, Velg et alternativ.

kilde: Microsoft

Mer om temaene: microsoft, Microsoft-lag, lag