Microsoft annoncerer offentlig tilgængelighed af to datavidenskabsværktøjer

Ikon for læsetid 1 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

cortana-intelligens-suite

Datavidenskabsmænd bruger en betydelig mængde tid på at skrive kode på at søge svar på nedenstående spørgsmål det meste af tiden.

  • Hvordan ser dataene ud? Hvad er skemaet?
  • Hvad er kvaliteten af ​​dataene? Hvad er alvoren af ​​manglende data?
  • Hvordan er individuelle variabler fordelt? Skal jeg lave variabel transformation?
  • Hvor relevante er dataene for maskinlæringsopgaven? Hvor svær er selve maskinlæringsopgaven?
  • Hvilke variabler er mest relevante for maskinlæringsmålet?
  • Er der noget specifikt klyngemønster i dataene?
  • Hvordan vil ML-modeller på dataene fungere? Hvilke variable er signifikante i modellerne?

Meget af koden kan generaliseres til datavidenskabsværktøjer, der kan genbruges på tværs af projekter, der hjælper dataforskere med at arbejde på specifikke opgaver i et projekt i en guidet tilstand, hvilket sikrer konsistens og fuldstændighed af de underliggende opgaver. For at hjælpe datavidenskabsfolk udgiver Microsoft to datavidenskabsværktøjer,

  1. Interaktiv dataudforskning, analyse og rapportering (IDEAR), og
  2. Automatiseret modellering og rapportering (AMAR).

Disse to hjælpeprogrammer, som kører i CRAN-R, kan tilgås fra denne GitHub-side.

Læs mere om disse hjælpeprogrammer link..

Mere om emnerne: analyse, Cortana Intelligence Suite, Dataudforskning, data, Science, machine learning, microsoft