Η Microsoft ανακοινώνει τη δημόσια διαθεσιμότητα δύο βοηθητικών προγραμμάτων επιστήμης δεδομένων
1 λεπτό. ανάγνωση
Δημοσιεύθηκε στις
Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα
Οι επιστήμονες δεδομένων αφιερώνουν σημαντικό χρόνο γράφοντας κώδικα αναζητώντας απαντήσεις στις παρακάτω ερωτήσεις τις περισσότερες φορές.
- Πώς φαίνονται τα δεδομένα; Ποιο είναι το σχήμα;
- Ποια είναι η ποιότητα των δεδομένων; Ποια είναι η σοβαρότητα των δεδομένων που λείπουν;
- Πώς κατανέμονται οι μεμονωμένες μεταβλητές; Χρειάζεται να κάνω μετασχηματισμό μεταβλητής;
- Πόσο σχετικά είναι τα δεδομένα με την εργασία μηχανικής εκμάθησης; Πόσο δύσκολη είναι η ίδια η εργασία μηχανικής μάθησης;
- Ποιες μεταβλητές είναι πιο σχετικές με τον στόχο μηχανικής εκμάθησης;
- Υπάρχει κάποιο συγκεκριμένο μοτίβο ομαδοποίησης στα δεδομένα;
- Πώς θα λειτουργήσουν τα μοντέλα ML στα δεδομένα; Ποιες μεταβλητές είναι σημαντικές στα μοντέλα;
Μεγάλο μέρος του κώδικα μπορεί να γενικευτεί σε βοηθητικά προγράμματα επιστήμης δεδομένων που μπορούν να επαναχρησιμοποιηθούν σε έργα βοηθώντας τους επιστήμονες δεδομένων να εργάζονται σε συγκεκριμένες εργασίες σε ένα έργο με καθοδηγούμενη λειτουργία, διασφαλίζοντας τη συνέπεια και την πληρότητα των υποκείμενων εργασιών. Για να βοηθήσει τους επιστήμονες δεδομένων, η Microsoft κυκλοφορεί δύο βοηθητικά προγράμματα επιστήμης δεδομένων,
- Διαδραστική Εξερεύνηση, Ανάλυση και Αναφορά Δεδομένων (IDEAR), και
- Αυτοματοποιημένη Μοντελοποίηση και Αναφορά (AMAR).
Αυτά τα δύο βοηθητικά προγράμματα, τα οποία εκτελούνται στο CRAN-R, είναι προσβάσιμα από αυτόν τον ιστότοπο GitHub.
Διαβάστε περισσότερα για αυτά τα βοηθητικά προγράμματα εδώ.