Microsoft kondigt de openbare beschikbaarheid aan van twee hulpprogramma's voor gegevenswetenschap

Pictogram voor leestijd 1 minuut. lezen

Kalender pictogram Uitgegeven op 19 oktober 2016

gepubliceerd op 19 oktober 2016

Lezers helpen MSpoweruser ondersteunen. We kunnen een commissie krijgen als u via onze links koopt.

Gegevenswetenschappers besteden een aanzienlijke hoeveelheid tijd aan het schrijven van code om antwoorden te zoeken op onderstaande vragen.

Hoe zien de gegevens eruit? Wat is het schema?
Wat is de kwaliteit van de gegevens? Wat is de ernst van ontbrekende gegevens?
Hoe zijn individuele variabelen verdeeld? Moet ik variabele transformatie doen?
Hoe relevant zijn de gegevens voor de machine learning-taak? Hoe moeilijk is de machine learning-taak zelf?
Welke variabelen zijn het meest relevant voor het doel van machine learning?
Is er een specifiek clusterpatroon in de gegevens?
Hoe presteren ML-modellen op de gegevens? Welke variabelen zijn significant in de modellen?

Een groot deel van de code kan worden gegeneraliseerd in hulpprogramma's voor gegevenswetenschap die kunnen worden hergebruikt in projecten, zodat gegevenswetenschappers in een begeleide modus aan specifieke taken in een project kunnen werken, waardoor consistentie en volledigheid van de onderliggende taken wordt gegarandeerd. Om datawetenschappers te helpen, brengt Microsoft twee datawetenschapshulpprogramma's uit,

Interactieve gegevensverkenning, -analyse en -rapportage (IDEAR), en
Geautomatiseerde modellering en rapportage (AMAR).

Deze twee hulpprogramma's, die in CRAN-R worden uitgevoerd, zijn toegankelijk via: deze GitHub-site.

Lees meer over deze hulpprogramma's hier.

Meer over de onderwerpen: analyse, Cortana Intelligence-suite, Gegevensverkenning, data Science, machine learning, microsoft

Pradeep Viswav

Software- en service-expert

Pradeep is afgestudeerd in computerwetenschappen en techniek. Hij was ook een Microsoft Student Partner. Momenteel werkt hij bij een toonaangevend IT-bedrijf.