Microsoft oznamuje veřejnou dostupnost dvou nástrojů pro datovou vědu
1 min. číst
Publikované dne
Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více
Datoví vědci tráví značné množství času psaním kódu hledáním odpovědí na níže uvedené otázky.
- Jak data vypadají? Jaké je schéma?
- Jaká je kvalita dat? Jaká je závažnost chybějících dat?
- Jak jsou rozděleny jednotlivé proměnné? Musím provést transformaci proměnné?
- Jak relevantní jsou data pro úlohu strojového učení? Jak náročný je samotný úkol strojového učení?
- Které proměnné jsou pro cíl strojového učení nejrelevantnější?
- Existuje v datech nějaký konkrétní vzor shlukování?
- Jak budou fungovat modely ML na datech? Které proměnné jsou v modelech významné?
Většinu kódu lze zobecnit do obslužných programů pro datovou vědu, které lze znovu použít v rámci projektů, což pomáhá datovým vědcům pracovat na konkrétních úkolech v projektu v řízeném režimu, což zajišťuje konzistenci a úplnost základních úkolů. Aby Microsoft pomohl datovým vědcům, uvolňuje dva nástroje pro vědu dat,
- Interactive Data Exploration, Analysis and Reporting (IDEAR) a
- Automated Modeling and Reporting (AMAR).
Tyto dva nástroje, které běží v CRAN-R, jsou přístupné z tento web GitHub.
Přečtěte si více o těchto nástrojích zde.