Microsoft najavljuje javnu dostupnost dvaju uslužnih programa za znanost o podacima

Ikona vremena čitanja 1 min. čitati

Ikona kalendara Objavljeno na Listopada 19, 2016

objavljeno Listopada 19, 2016

Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza.

Znanstvenici za podatke provode znatnu količinu vremena pišući kod tražeći odgovore na pitanja u nastavku većinu vremena.

Kako izgledaju podaci? Koja je shema?
Kakva je kvaliteta podataka? Koja je ozbiljnost podataka koji nedostaju?
Kako su raspoređene pojedinačne varijable? Trebam li napraviti transformaciju varijable?
Koliko su podaci relevantni za zadatak strojnog učenja? Koliko je sam zadatak strojnog učenja težak?
Koje su varijable najrelevantnije za cilj strojnog učenja?
Postoji li neki specifičan uzorak grupiranja u podacima?
Kako će se ML modeli ponašati na podacima? Koje su varijable značajne u modelima?

Velik dio koda može se generalizirati u pomoćne programe za znanost o podacima koji se mogu ponovno koristiti u projektima pomažući znanstvenicima da rade na određenim zadacima u projektu u vođenom načinu, osiguravajući dosljednost i potpunost temeljnih zadataka. Kako bi pomogao znanstvenicima podataka, Microsoft izdaje dva uslužna programa za znanost o podacima,

Interaktivno istraživanje podataka, analiza i izvješćivanje (IDEAR), i
Automatizirano modeliranje i izvješćivanje (AMAR).

Ova dva uslužna programa, koji rade u CRAN-R, mogu se pristupiti iz ovo GitHub mjesto.

Pročitajte više o ovim uslužnim programima ovdje.

Više o temama: analiza, Cortana Intelligence Suite, Istraživanje podataka, Znanost podatke, stroj za učenje, Microsoft

Pradeep Viswav

Stručnjak za softver i usluge

Pradeep je diplomirao računarstvo i inženjerstvo. Bio je i Microsoftov studentski partner. Trenutno radi u vodećoj IT tvrtki.