Microsoft meddelar att två datavetenskapsverktyg är tillgängliga för allmänheten

Lästid ikon 1 min. läsa


Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar. Verktygstipsikon

Läs vår informationssida för att ta reda på hur du kan hjälpa MSPoweruser upprätthålla redaktionen Läs mer

cortana-intelligens-svit

Dataforskare lägger ner en betydande tid på att skriva kod för att söka svar på nedanstående frågor för det mesta.

  • Hur ser uppgifterna ut? Vad är schemat?
  • Vad är kvaliteten på uppgifterna? Hur allvarlig är saknad data?
  • Hur fördelas individuella variabler? Behöver jag göra variabel transformation?
  • Hur relevant är data för maskininlärningsuppgiften? Hur svår är själva maskininlärningsuppgiften?
  • Vilka variabler är mest relevanta för maskininlärningsmålet?
  • Finns det något specifikt klustringsmönster i data?
  • Hur kommer ML-modeller på data att fungera? Vilka variabler är signifikanta i modellerna?

Mycket av koden kan generaliseras till datavetenskapliga verktyg som kan återanvändas i projekt som hjälper datavetare att arbeta med specifika uppgifter i ett projekt i ett guidat läge, vilket säkerställer konsekvens och fullständighet för de underliggande uppgifterna. För att hjälpa datavetare släpper Microsoft två datavetenskapsverktyg,

  1. Interaktiv datautforskning, analys och rapportering (IDEAR), och
  2. Automatiserad modellering och rapportering (AMAR).

Dessa två verktyg, som körs i CRAN-R, kan nås från denna GitHub-sajt.

Läs mer om dessa verktyg här..

Mer om ämnena: analys, Cortana Intelligence Suite, Dataforskning, Data Science, maskininlärning, microsoft