Microsoft najavljuje javnu dostupnost dvaju uslužnih programa za znanost o podacima

Ikona vremena čitanja 1 min. čitati


Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza. Ikona opisa alata

Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više

cortana-inteligencija-apartman

Znanstvenici za podatke provode znatnu količinu vremena pišući kod tražeći odgovore na pitanja u nastavku većinu vremena.

  • Kako izgledaju podaci? Koja je shema?
  • Kakva je kvaliteta podataka? Koja je ozbiljnost podataka koji nedostaju?
  • Kako su raspoređene pojedinačne varijable? Trebam li napraviti transformaciju varijable?
  • Koliko su podaci relevantni za zadatak strojnog učenja? Koliko je sam zadatak strojnog učenja težak?
  • Koje su varijable najrelevantnije za cilj strojnog učenja?
  • Postoji li neki specifičan uzorak grupiranja u podacima?
  • Kako će se ML modeli ponašati na podacima? Koje su varijable značajne u modelima?

Velik dio koda može se generalizirati u pomoćne programe za znanost o podacima koji se mogu ponovno koristiti u projektima pomažući znanstvenicima da rade na određenim zadacima u projektu u vođenom načinu, osiguravajući dosljednost i potpunost temeljnih zadataka. Kako bi pomogao znanstvenicima podataka, Microsoft izdaje dva uslužna programa za znanost o podacima,

  1. Interaktivno istraživanje podataka, analiza i izvješćivanje (IDEAR), i
  2. Automatizirano modeliranje i izvješćivanje (AMAR).

Ova dva uslužna programa, koji rade u CRAN-R, mogu se pristupiti iz ovo GitHub mjesto.

Pročitajte više o ovim uslužnim programima ovdje.

Više o temama: analiza, Cortana Intelligence Suite, Istraživanje podataka, Znanost podatke, stroj za učenje, Microsoft