Microsoft kondigt de openbare beschikbaarheid aan van twee hulpprogramma's voor gegevenswetenschap

Pictogram voor leestijd 1 minuut. lezen


Lezers helpen MSpoweruser ondersteunen. We kunnen een commissie krijgen als u via onze links koopt. Tooltip-pictogram

Lees onze openbaarmakingspagina om erachter te komen hoe u MSPoweruser kunt helpen het redactieteam te ondersteunen Lees meer

cortana-intelligentie-suite

Gegevenswetenschappers besteden een aanzienlijke hoeveelheid tijd aan het schrijven van code om antwoorden te zoeken op onderstaande vragen.

  • Hoe zien de gegevens eruit? Wat is het schema?
  • Wat is de kwaliteit van de gegevens? Wat is de ernst van ontbrekende gegevens?
  • Hoe zijn individuele variabelen verdeeld? Moet ik variabele transformatie doen?
  • Hoe relevant zijn de gegevens voor de machine learning-taak? Hoe moeilijk is de machine learning-taak zelf?
  • Welke variabelen zijn het meest relevant voor het doel van machine learning?
  • Is er een specifiek clusterpatroon in de gegevens?
  • Hoe presteren ML-modellen op de gegevens? Welke variabelen zijn significant in de modellen?

Een groot deel van de code kan worden gegeneraliseerd in hulpprogramma's voor gegevenswetenschap die kunnen worden hergebruikt in projecten, zodat gegevenswetenschappers in een begeleide modus aan specifieke taken in een project kunnen werken, waardoor consistentie en volledigheid van de onderliggende taken wordt gegarandeerd. Om datawetenschappers te helpen, brengt Microsoft twee datawetenschapshulpprogramma's uit,

  1. Interactieve gegevensverkenning, -analyse en -rapportage (IDEAR), en
  2. Geautomatiseerde modellering en rapportage (AMAR).

Deze twee hulpprogramma's, die in CRAN-R worden uitgevoerd, zijn toegankelijk via: deze GitHub-site.

Lees meer over deze hulpprogramma's hier.

Meer over de onderwerpen: analyse, Cortana Intelligence-suite, Gegevensverkenning, data Science, machine learning, microsoft