Microsoft napoveduje javno dostopnost dveh pripomočkov za podatkovno znanost

Ikona časa branja 1 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

cortana-inteligence-suite

Podatkovni znanstveniki večino časa porabijo veliko časa za pisanje kode in iščejo odgovore na spodnja vprašanja.

  • Kako izgledajo podatki? Kakšna je shema?
  • Kakšna je kakovost podatkov? Kakšna je resnost manjkajočih podatkov?
  • Kako so posamezne spremenljivke porazdeljene? Ali moram narediti spremenljivko transformacijo?
  • Kako pomembni so podatki za nalogo strojnega učenja? Kako težka je naloga strojnega učenja sama?
  • Katere spremenljivke so najbolj pomembne za cilj strojnega učenja?
  • Ali je v podatkih kakšen poseben vzorec združevanja?
  • Kako bodo delovali modeli ML na podatkih? Katere spremenljivke so pomembne v modelih?

Velik del kode je mogoče posplošiti v pripomočke za znanost o podatkih, ki jih je mogoče ponovno uporabiti v projektih in pomagati podatkovnim znanstvenikom pri delu pri določenih nalogah v projektu v vodenem načinu, kar zagotavlja doslednost in popolnost osnovnih nalog. Za pomoč podatkovnim znanstvenikom Microsoft izdaja dva pripomočka za podatkovno znanost,

  1. Interaktivno raziskovanje, analiza in poročanje podatkov (IDEAR) in
  2. Avtomatizirano modeliranje in poročanje (AMAR).

Do teh dveh pripomočkov, ki delujeta v CRAN-R, je mogoče dostopati to spletno mesto GitHub.

Preberite več o teh pripomočkih tukaj.

Več o temah: Analiza, Cortana Intelligence Suite, Raziskovanje podatkov, Znanost podatki, strojno učenje, microsoft