Microsoft najavljuje javnu dostupnost dvaju uslužnih programa za znanost o podacima
1 min. čitati
Objavljeno na
Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više
Znanstvenici za podatke provode znatnu količinu vremena pišući kod tražeći odgovore na pitanja u nastavku većinu vremena.
- Kako izgledaju podaci? Koja je shema?
- Kakva je kvaliteta podataka? Koja je ozbiljnost podataka koji nedostaju?
- Kako su raspoređene pojedinačne varijable? Trebam li napraviti transformaciju varijable?
- Koliko su podaci relevantni za zadatak strojnog učenja? Koliko je sam zadatak strojnog učenja težak?
- Koje su varijable najrelevantnije za cilj strojnog učenja?
- Postoji li neki specifičan uzorak grupiranja u podacima?
- Kako će se ML modeli ponašati na podacima? Koje su varijable značajne u modelima?
Velik dio koda može se generalizirati u pomoćne programe za znanost o podacima koji se mogu ponovno koristiti u projektima pomažući znanstvenicima da rade na određenim zadacima u projektu u vođenom načinu, osiguravajući dosljednost i potpunost temeljnih zadataka. Kako bi pomogao znanstvenicima podataka, Microsoft izdaje dva uslužna programa za znanost o podacima,
- Interaktivno istraživanje podataka, analiza i izvješćivanje (IDEAR), i
- Automatizirano modeliranje i izvješćivanje (AMAR).
Ova dva uslužna programa, koji rade u CRAN-R, mogu se pristupiti iz ovo GitHub mjesto.
Pročitajte više o ovim uslužnim programima ovdje.