Microsoft oznamuje veřejnou dostupnost dvou nástrojů pro datovou vědu

Ikona času čtení 1 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více

cortana-inteligence-suite

Datoví vědci tráví značné množství času psaním kódu hledáním odpovědí na níže uvedené otázky.

  • Jak data vypadají? Jaké je schéma?
  • Jaká je kvalita dat? Jaká je závažnost chybějících dat?
  • Jak jsou rozděleny jednotlivé proměnné? Musím provést transformaci proměnné?
  • Jak relevantní jsou data pro úlohu strojového učení? Jak náročný je samotný úkol strojového učení?
  • Které proměnné jsou pro cíl strojového učení nejrelevantnější?
  • Existuje v datech nějaký konkrétní vzor shlukování?
  • Jak budou fungovat modely ML na datech? Které proměnné jsou v modelech významné?

Většinu kódu lze zobecnit do obslužných programů pro datovou vědu, které lze znovu použít v rámci projektů, což pomáhá datovým vědcům pracovat na konkrétních úkolech v projektu v řízeném režimu, což zajišťuje konzistenci a úplnost základních úkolů. Aby Microsoft pomohl datovým vědcům, uvolňuje dva nástroje pro vědu dat,

  1. Interactive Data Exploration, Analysis and Reporting (IDEAR) a
  2. Automated Modeling and Reporting (AMAR).

Tyto dva nástroje, které běží v CRAN-R, jsou přístupné z tento web GitHub.

Přečtěte si více o těchto nástrojích zde.

Více o tématech: analýza, Cortana Intelligence Suite, Průzkum dat, Data Science, strojové učení, microsoft