Microsoft kommer att erbjuda AI-baserad brusreducering till Microsoft Teams på Mac och mobila plattformar

Lästid ikon 3 min. läsa


Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar. Verktygstipsikon

Läs vår informationssida för att ta reda på hur du kan hjälpa MSPoweruser upprätthålla redaktionen Läs mer

Microsoft-lag

Microsoft-lag

Förra månaden, Microsoft meddelade utrullningen av bakgrunds-AI-baserad brusreduceringsfunktion i realtid till Microsoft Teams Windows-användare. Den här funktionen kan dämpa onödigt brus som att blanda papper, smälla dörrar och skällande hundar under ett Teams-samtal. AI-baserad brusreducering fungerar genom att analysera en individs ljudflöde och använda specialtränade djupa neurala nätverk för att filtrera bort bruset och bara behålla talsignalen. Microsoft tillkännagav idag att de arbetar med att föra AI-baserad brusreducering till Microsoft Teams på Mac och mobila plattformar.

Microsoft har idag också förklarat hur de utvecklade den här funktionen utan att använda faktisk kunddata. Microsoft optimerade modellen för djupinlärning på ett sätt så att den kunde köras effektivt på Teams skrivbordsklient i realtid utan mycket omkostnader.

För att uppnå denna mångfald av dataset har vi skapat en stor datamängd med cirka 760 timmars rent taldata och 180 timmars brusdata. För att följa Microsofts strikta sekretessstandarder har vi sett till att ingen kunddata samlas in för denna datamängd. Istället använde vi antingen offentligt tillgänglig data eller crowdsourcing för att samla in specifika scenarier. För rent tal såg vi till att vi hade en balans mellan kvinnligt och manligt tal och vi samlade in data från 10+ språk som även inkluderar tonala språk för att säkerställa att vår modell inte kommer att ändra innebörden av en mening genom att förvränga tonen i orden. För bullerdata inkluderade vi 150 brustyper för att säkerställa att vi täcker olika scenarier som våra kunder kan stöta på från tangentbordsskrivning till toalettspolning eller snarkning. En annan viktig aspekt var att inkludera känslor i vårt rena tal så att uttryck som skratt eller gråt inte undertrycks. Egenskaperna hos den miljö från vilken våra kunder går med i deras online Teams-möten har också en stark inverkan på talsignalen. För att fånga den mångfalden tränade vi vår modell med data från mer än 3,000 115,000 verkliga rumsmiljöer och mer än XNUMX XNUMX syntetiskt skapade rum.

Eftersom vi använder djupinlärning är det viktigt att ha en kraftfull modellutbildningsinfrastruktur. Vi använder Microsoft Azure för att låta vårt team utveckla förbättrade versioner av vår ML-modell. En annan utmaning är att utvinningen av ursprungligt rent tal från bruset måste göras på ett sätt som det mänskliga örat uppfattar som naturligt och behagligt. Eftersom det inte finns några objektiva mätvärden som är starkt korrelerade till mänsklig perception, utvecklade vi ett ramverk som gjorde det möjligt för oss att skicka de bearbetade ljudproverna till crowdsourcing-leverantörer där mänskliga lyssnare betygsatte sin ljudkvalitet på en en- till femstjärnig skala för att producera genomsnittliga åsiktspoäng (MOS). Med dessa mänskliga betyg kunde vi utveckla ett nytt perceptuellt mått som tillsammans med de subjektiva mänskliga betygen gjorde det möjligt för oss att göra snabba framsteg med att förbättra kvaliteten på våra modeller för djupinlärning.

Så här kan du aktivera brusreduceringsfunktionen i Teams:

  1. Välj din profilbild uppe till höger i Teams och välj sedan Inställningar.
  2. Välja enheter till vänster och sedan under Ljuddämpning, Välj ett alternativ.

  3. Från mötesfönstret:
    1. Välja Fler alternativ  i dina möteskontroller och välj sedan Enhetsinställningar.
    2. Enligt Ljuddämpning, Välj ett alternativ.

Källa: Microsoft

Mer om ämnena: microsoft, Microsoft-lag, lag

Kommentera uppropet

E-postadressen publiceras inte. Obligatoriska fält är markerade *