Što je Metin novi AI modul za audio kompoziciju iz pukih upita, MAGNeT?

Ikona vremena čitanja 2 min. čitati


Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza. Ikona opisa alata

Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više

Meta trgovina

Metin MAGNeT je novi model teksta u zvuk koji može generirati visokokvalitetni zvuk iz tekstualnih opisa.

MAGNeT odstupa od tradicionalnih autoregresivnih metoda, koje generiraju audio segment po segment koristeći neautoregresivni pristup. To omogućuje paralelno predviđanje više audio segmenata, značajno povećavajući brzinu generiranja. Referentne vrijednosti pokazuju da MAGNeT može biti do sedam puta brži od svojih prethodnika.

To znači da može predvidjeti više audio dijelova istovremeno umjesto da ih generira jedan za drugim. Ovo je kao da imate hrpu pećnica koje kuhaju različita jela odjednom.

Nadalje, MAGNeT uključuje hibridni mehanizam koji kombinira početnu točnost autoregresivnih tehnika s učinkovitošću neautoregresivnih metoda. To osigurava da generirani zvuk zadrži visoku vjernost, a istovremeno ima koristi od povećane brzine.

Drugim riječima, koristi posebnu tehniku ​​"hibridnog mehanizma" kako bi osigurao dobar zvuk unatoč brzom generiranju.

Potencijalne primjene MAGNeT-a su ogromne i obuhvaćaju različite industrije. Evo nekoliko značajnih primjera:

  • Glazbena kompozicija: Glazbenici i producenti mogu koristiti MAGNeT za brzo eksperimentiranje s novim idejama i generiranje glazbenih elemenata potpomognutih umjetnom inteligencijom.
  • Dizajn zvuka za film i igru: MAGNeT može stvoriti dinamične i impresivne zvučne zapise u stvarnom vremenu, poboljšavajući iskustvo za gledatelje i igrače.
  • Glasovno upravljane aplikacije: Sposobnost modela da generira sintetičke glasove prirodnog zvuka obećava za virtualne asistente i druge glasovno interaktivne tehnologije.
  • Alati za pristupačnost: MAGNeT-ove mogućnosti pretvorbe teksta u govor u stvarnom vremenu mogle bi osnažiti pojedince s oštećenjima vida i revolucionirati rješenja pristupačnosti.

Meta AI je odabrao open-source MAGNeT, potičući suradnju i inovacije u generiranju teksta u zvuk. Pristup otvorenog izvornog koda također utire put stvaranju novih metodologija umjetne inteligencije u dizajnu zvuka i drugim područjima u kojima umjetna inteligencija komunicira s ljudskim osjetilima.

Važno je napomenuti da je MAGNeT još uvijek u razvoju, a njegove mogućnosti i ograničenja se i dalje istražuju. 

more ovdje.

Više o temama: Meta