Microsoft anunță disponibilitatea publică a două utilitare pentru știința datelor
1 min. citit
Publicat în data de
Citiți pagina noastră de dezvăluire pentru a afla cum puteți ajuta MSPoweruser să susțină echipa editorială Află mai multe
Oamenii de știință de date petrec o cantitate semnificativă de timp scriind coduri căutând răspunsuri la întrebările de mai jos de cele mai multe ori.
- Cum arată datele? Care este schema?
- Care este calitatea datelor? Care este gravitatea datelor lipsă?
- Cum sunt distribuite variabilele individuale? Trebuie să fac o transformare variabilă?
- Cât de relevante sunt datele pentru sarcina de învățare automată? Cât de dificilă este însăși sarcina de învățare automată?
- Ce variabile sunt cele mai relevante pentru obiectivul de învățare automată?
- Există vreun model de grupare specific în date?
- Cum vor funcționa modelele ML pe date? Ce variabile sunt semnificative în modele?
O mare parte din cod poate fi generalizată în utilități de știință a datelor care pot fi reutilizate în cadrul proiectelor, ajutând oamenii de știință de date să lucreze la sarcini specifice dintr-un proiect într-un mod ghidat, asigurând coerența și completitudinea sarcinilor subiacente. Pentru a ajuta oamenii de știință de date, Microsoft lansează două utilitare pentru știința datelor,
- Explorare, analiză și raportare interactivă a datelor (IDEAR) și
- Modelare și raportare automată (AMAR).
Aceste două utilitare, care rulează în CRAN-R, pot fi accesate de la acest site GitHub.
Citiți mai multe despre aceste utilități aici.