Microsoft ogłasza publiczną dostępność dwóch narzędzi do analizy danych
1 minuta. czytać
Opublikowany
Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej
Analitycy danych przez większość czasu spędzają dużo czasu na pisaniu kodu, szukając odpowiedzi na poniższe pytania.
- Jak wyglądają dane? Jaki jest schemat?
- Jaka jest jakość danych? Jaka jest waga brakujących danych?
- Jak rozkładają się poszczególne zmienne? Czy muszę wykonać transformację zmiennych?
- Jak istotne są dane dla zadania uczenia maszynowego? Jak trudne jest samo zadanie uczenia maszynowego?
- Które zmienne są najbardziej odpowiednie dla celu uczenia maszynowego?
- Czy w danych występuje jakiś konkretny wzorzec klastrowania?
- Jak będą działać modele ML na danych? Jakie zmienne są istotne w modelach?
Znaczną część kodu można uogólnić na narzędzia do nauki danych, które można ponownie wykorzystać w różnych projektach, pomagając analitykom danych pracować nad określonymi zadaniami w projekcie w trybie z przewodnikiem, zapewniając spójność i kompletność podstawowych zadań. Aby pomóc naukowcom danych, firma Microsoft udostępnia dwa narzędzia do analizy danych:
- Interaktywna eksploracja, analiza i raportowanie danych (IDEAR) oraz
- Automatyczne modelowanie i raportowanie (AMAR).
Te dwa narzędzia, które działają w CRAN-R, są dostępne z ta witryna GitHub.
Przeczytaj więcej o tych narzędziach tutaj.