Microsoft anunță disponibilitatea publică a două utilitare pentru știința datelor

Pictograma timp de citire 1 min. citit


Cititorii ajută la sprijinirea MSpoweruser. Este posibil să primim un comision dacă cumpărați prin link-urile noastre. Pictograma Tooltip

Citiți pagina noastră de dezvăluire pentru a afla cum puteți ajuta MSPoweruser să susțină echipa editorială Află mai multe

cortana-intelligence-suite

Oamenii de știință de date petrec o cantitate semnificativă de timp scriind coduri căutând răspunsuri la întrebările de mai jos de cele mai multe ori.

  • Cum arată datele? Care este schema?
  • Care este calitatea datelor? Care este gravitatea datelor lipsă?
  • Cum sunt distribuite variabilele individuale? Trebuie să fac o transformare variabilă?
  • Cât de relevante sunt datele pentru sarcina de învățare automată? Cât de dificilă este însăși sarcina de învățare automată?
  • Ce variabile sunt cele mai relevante pentru obiectivul de învățare automată?
  • Există vreun model de grupare specific în date?
  • Cum vor funcționa modelele ML pe date? Ce variabile sunt semnificative în modele?

O mare parte din cod poate fi generalizată în utilități de știință a datelor care pot fi reutilizate în cadrul proiectelor, ajutând oamenii de știință de date să lucreze la sarcini specifice dintr-un proiect într-un mod ghidat, asigurând coerența și completitudinea sarcinilor subiacente. Pentru a ajuta oamenii de știință de date, Microsoft lansează două utilitare pentru știința datelor,

  1. Explorare, analiză și raportare interactivă a datelor (IDEAR) și
  2. Modelare și raportare automată (AMAR).

Aceste două utilitare, care rulează în CRAN-R, pot fi accesate de la acest site GitHub.

Citiți mai multe despre aceste utilități aici.

Mai multe despre subiecte: analiză, Cortana Intelligence Suite, Explorarea datelor, Știința datelor, masina de învățare, microsoft