Microsoft přinese potlačení hluku založené na umělé inteligenci do Microsoft Teams na Mac a mobilních platformách

Ikona času čtení 3 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více

Týmy společnosti Microsoft

Týmy společnosti Microsoft

Minulý měsíc, Microsoft oznámila, zavedení funkce potlačení hluku na pozadí založené na umělé inteligenci v reálném čase pro uživatele počítačů Microsoft Teams Windows. Tato funkce dokáže potlačit zbytečný hluk, jako je míchání papírů, bouchání dveřmi a štěkání psů během hovoru Teams. Potlačení šumu na bázi umělé inteligence funguje tak, že analyzuje audio signál jednotlivce a pomocí speciálně trénovaných hlubokých neuronových sítí odfiltruje šum a zachová pouze řečový signál. Společnost Microsoft dnes oznámila, že pracuje na zavedení potlačení hluku založeného na umělé inteligenci do Microsoft Teams pro Mac a mobilní platformy.

Microsoft dnes také vysvětlil, jak vyvinuli tuto funkci bez použití skutečných dat zákazníků. Microsoft optimalizoval model hlubokého učení tak, aby mohl efektivně běžet na desktopovém klientovi Teams v reálném čase bez velké režie.

Abychom dosáhli této rozmanitosti datové sady, vytvořili jsme velkou datovou sadu s přibližně 760 hodinami čistých řečových dat a 180 hodinami šumových dat. Abychom vyhověli přísným standardům ochrany osobních údajů společnosti Microsoft, zajistili jsme, že pro tento soubor dat nebudou shromažďována žádná data zákazníků. Místo toho jsme ke sběru konkrétních scénářů použili buď veřejně dostupná data, nebo crowdsourcing. Pro čistou řeč jsme zajistili vyváženost ženské a mužské řeči a shromáždili jsme data z 10+ jazyků, které zahrnují také tónové jazyky, abychom zajistili, že náš model nezmění význam věty zkreslením tónu slov. Pro údaje o hluku jsme zahrnuli 150 typů hluku, abychom zajistili pokrytí různých scénářů, se kterými se naši zákazníci mohou setkat, od psaní na klávesnici až po splachování toalety nebo chrápání. Dalším důležitým aspektem bylo zahrnout emoce do naší čisté řeči, aby nebyly potlačeny projevy jako smích nebo pláč. Charakteristiky prostředí, ze kterého se naši zákazníci připojují k jejich online schůzkám Teams, mají také silný dopad na řečový signál. Abychom tuto rozmanitost zachytili, trénovali jsme náš model s daty z více než 3,000 115,000 prostředí skutečných místností a více než XNUMX XNUMX synteticky vytvořených místností.

Protože používáme hluboké učení, je důležité mít výkonnou modelovou školicí infrastrukturu. Používáme Microsoft Azure, abychom našemu týmu umožnili vyvíjet vylepšené verze našeho modelu ML. Další výzvou je, že extrakci původní čisté řeči z hluku je třeba provést způsobem, který lidské ucho vnímá jako přirozený a příjemný. Vzhledem k tomu, že neexistují žádné objektivní metriky, které by vysoce korelovaly s lidským vnímáním, vyvinuli jsme rámec, který nám umožnil posílat zpracované zvukové vzorky prodejcům crowdsourcingu, kde lidští posluchači hodnotili kvalitu zvuku na stupnici od jedné do pěti hvězdiček, aby vytvořili průměrné skóre mínění. (MOS). S těmito lidskými hodnoceními jsme byli schopni vyvinout novou percepční metriku, která nám spolu se subjektivním lidským hodnocením umožnila udělat rychlý pokrok ve zlepšování kvality našich modelů hlubokého učení.

Zde je návod, jak povolit funkci potlačení hluku v Teams:

  1. Vyberte svůj profilový obrázek v pravém horním rohu Teams a poté vyberte Nastavení.
  2. vybrat Zařízení vlevo a pak pod Potlačení ruchu, Vyberte možnost.

  3. Z okna schůzky:
    1. vybrat Více možností  v ovládacích prvcích schůzky a poté vyberte Nastavení zařízení.
    2. Pod Potlačení ruchu, Vyberte možnost.

Zdroj: Microsoft

Více o tématech: microsoft, Týmy společnosti Microsoft, týmy

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *