Microsoft anunță disponibilitatea publică a două utilitare pentru știința datelor

Pictograma timp de citire 1 min. citit

Pictogramă calendar Publicat în data de Octombrie 19, 2016

publicat pe Octombrie 19, 2016

Cititorii ajută la sprijinirea MSpoweruser. Este posibil să primim un comision dacă cumpărați prin link-urile noastre.

Oamenii de știință de date petrec o cantitate semnificativă de timp scriind coduri căutând răspunsuri la întrebările de mai jos de cele mai multe ori.

Cum arată datele? Care este schema?
Care este calitatea datelor? Care este gravitatea datelor lipsă?
Cum sunt distribuite variabilele individuale? Trebuie să fac o transformare variabilă?
Cât de relevante sunt datele pentru sarcina de învățare automată? Cât de dificilă este însăși sarcina de învățare automată?
Ce variabile sunt cele mai relevante pentru obiectivul de învățare automată?
Există vreun model de grupare specific în date?
Cum vor funcționa modelele ML pe date? Ce variabile sunt semnificative în modele?

O mare parte din cod poate fi generalizată în utilități de știință a datelor care pot fi reutilizate în cadrul proiectelor, ajutând oamenii de știință de date să lucreze la sarcini specifice dintr-un proiect într-un mod ghidat, asigurând coerența și completitudinea sarcinilor subiacente. Pentru a ajuta oamenii de știință de date, Microsoft lansează două utilitare pentru știința datelor,

Explorare, analiză și raportare interactivă a datelor (IDEAR) și
Modelare și raportare automată (AMAR).

Aceste două utilitare, care rulează în CRAN-R, pot fi accesate de la acest site GitHub.

Citiți mai multe despre aceste utilități aici.

Mai multe despre subiecte: analiză, Cortana Intelligence Suite, Explorarea datelor, Știința datelor, masina de învățare, microsoft

Pradeep Viswav

Expert în software și servicii

Pradeep este absolvent de informatică și inginerie. A fost, de asemenea, partener student Microsoft. În prezent lucrează într-o companie lider în IT.