A Microsoft bejelentette két adattudományi segédprogram nyilvános elérhetőségét

Kezdőlap » Égszínkék

Olvasási idő ikonra 1 perc olvas

Naptár ikonra Publikálva Október 19, 2016

by Pradeep Viswav

közzétették Október 19, 2016

Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol.

Az adattudósok jelentős időt töltenek kódírással, és az idő nagy részében választ keresnek az alábbi kérdésekre.

Hogyan néznek ki az adatok? Mi a séma?
Milyen minőségűek az adatok? Milyen súlyosságúak a hiányzó adatok?
Hogyan oszlanak meg az egyes változók? Változótranszformációt kell végeznem?
Mennyire relevánsak az adatok a gépi tanulási feladat szempontjából? Mennyire nehéz maga a gépi tanulási feladat?
Mely változók a leginkább relevánsak a gépi tanulási cél szempontjából?
Van-e konkrét klaszterezési minta az adatokban?
Hogyan teljesítenek az adatokon lévő ML-modellek? Mely változók szignifikánsak a modellekben?

A kód nagy része általánosítható adattudományi segédprogramokká, amelyek újrafelhasználhatók a projektekben, segítve az adatkutatókat, hogy irányított módban dolgozzanak a projektben meghatározott feladatokon, biztosítva a mögöttes feladatok következetességét és teljességét. Az adattudósok segítésére a Microsoft két adattudományi segédprogramot ad ki,

Interaktív adatfeltárás, -elemzés és -jelentés (IDEAR), ill
Automatizált modellezés és jelentéskészítés (AMAR).

Ez a két, CRAN-R-ben futó segédprogram a címről érhető el ezen a GitHub webhelyen.

Olvasson többet ezekről a segédprogramokról itt.

Bővebben a témákról: elemzés, Cortana Intelligence Suite, Adatfeltárás, Data Science, gépi tanulás, microsoft

Pradeep Viswav

Szoftver- és szolgáltatásszakértő

Pradeep számítástechnikai és mérnöki végzettségű. A Microsoft diákpartnere is volt. Jelenleg egy vezető informatikai cégnél dolgozik.