Microsoft kündigt die öffentliche Verfügbarkeit von zwei Data-Science-Dienstprogrammen an

Symbol für die Lesezeit 1 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Lesen Sie weiter

Cortana-Intelligence-Suite

Data Scientists verbringen die meiste Zeit viel Zeit damit, Code zu schreiben, um Antworten auf die folgenden Fragen zu finden.

  • Wie sehen die Daten aus? Was ist das Schema?
  • Wie ist die Qualität der Daten? Wie schwerwiegend sind fehlende Daten?
  • Wie sind einzelne Variablen verteilt? Muss ich eine Variablentransformation durchführen?
  • Wie relevant sind die Daten für die maschinelle Lernaufgabe? Wie schwierig ist die maschinelle Lernaufgabe selbst?
  • Welche Variablen sind für das maschinelle Lernziel am relevantesten?
  • Gibt es ein bestimmtes Clustering-Muster in den Daten?
  • Wie werden ML-Modelle auf den Daten funktionieren? Welche Variablen sind in den Modellen signifikant?

Ein Großteil des Codes kann in Data-Science-Dienstprogramme verallgemeinert werden, die projektübergreifend wiederverwendet werden können, um Data Scientists bei der Arbeit an bestimmten Aufgaben in einem Projekt in einem geführten Modus zu unterstützen und die Konsistenz und Vollständigkeit der zugrunde liegenden Aufgaben sicherzustellen. Um Data Scientists zu helfen, veröffentlicht Microsoft zwei Data Science-Dienstprogramme:

  1. Interactive Data Exploration, Analysis and Reporting (IDEAR) und
  2. Automatisierte Modellierung und Berichterstattung (AMAR).

Auf diese beiden Dienstprogramme, die in CRAN-R ausgeführt werden, kann zugegriffen werden diese GitHub-Site.

Lesen Sie mehr über diese Dienstprogramme hier.

Mehr zu den Themen: Analyse, Cortana Intelligence-Suite, Datenexploration, Daten Wissenschaft, Maschinelles Lernen, Microsoft