Jaký je nový modul umělé inteligence Meta pro kompozici zvuku z pouhých výzev, MAGNeT?

Ikona času čtení 2 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více

Meta Store

Meta's MAGNeT je nový model převodu textu na zvuk schopný generovat vysoce kvalitní zvuk z textových popisů.

MAGNeT se odchyluje od tradičních autoregresivních metod, které generují zvuk po jednotlivých segmentech pomocí neautoregresního přístupu. To umožňuje paralelní predikci více audio segmentů, což výrazně zvyšuje rychlost generování. Benchmarky ukazují, že MAGNeT může být až sedmkrát rychlejší než jeho předchůdci.

To znamená, že dokáže předvídat více zvukových částí současně, místo aby je generoval jednu po druhé. Je to jako mít v troubách různé pokrmy najednou.

Navíc MAGNeT obsahuje hybridní mechanismus, který kombinuje počáteční přesnost autoregresních technik s účinností neautoregresních metod. To zajišťuje, že generovaný zvuk si zachová vysokou věrnost a zároveň těží ze zvýšené rychlosti.

Jinými slovy, používá speciální techniku ​​„hybridního mechanismu“, která zajišťuje, že zvuk bude znít dobře, přestože je generován rychle.

Potenciální aplikace MAGNeT jsou rozsáhlé a zahrnují různá průmyslová odvětví. Zde jsou některé pozoruhodné příklady:

  • hudební složení: Hudebníci a producenti mohou využít MAGNeT k rychlému experimentování s novými nápady a vytváření hudebních prvků za pomoci umělé inteligence.
  • Zvukový design filmu a her: MAGNeT dokáže vytvářet dynamické a pohlcující zvukové stopy v reálném čase, což zlepšuje zážitek pro diváky a hráče.
  • Aplikace řízené hlasem: Schopnost modelu generovat přirozeně znějící syntetické hlasy je příslibem pro virtuální asistenty a další hlasově interaktivní technologie.
  • Nástroje pro usnadnění: Možnosti převodu textu na řeč v reálném čase MAGNeT by mohly posílit jednotlivce se zrakovým postižením a způsobit revoluci v řešeních přístupnosti.

meta Umělá inteligence se rozhodla pro open source MAGNeT, čímž podporuje spolupráci a inovace v generování převodu textu na zvuk. Přístup s otevřeným zdrojovým kódem také připravuje cestu pro vytváření nových metodologií umělé inteligence ve zvukovém designu a dalších oblastech, kde umělá inteligence interaguje s lidskými smysly.

Je důležité poznamenat, že MAGNeT je stále ve vývoji a jeho schopnosti a omezení se nadále zkoumají. 

Moře zde.

Více o tématech: meta