Microsoft ilmoittaa kahden datatieteen apuohjelman julkisesta saatavuudesta

Lukuajan kuvake 1 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

cortana-intelligence-sviitti

Datatieteilijät käyttävät paljon aikaa koodin kirjoittamiseen etsiessään vastauksia alla oleviin kysymyksiin suurimman osan ajasta.

  • Miltä data näyttää? Mikä on kaava?
  • Mikä on tietojen laatu? Mikä on puuttuvien tietojen vakavuus?
  • Miten yksittäiset muuttujat jakautuvat? Pitääkö minun tehdä muuttujamuunnos?
  • Kuinka relevanttia data on koneoppimistehtävän kannalta? Kuinka vaikea itse koneoppimistehtävä on?
  • Mitkä muuttujat ovat oleellisimmat koneoppimistavoitteen kannalta?
  • Onko tiedoissa tiettyä klusterointimallia?
  • Kuinka datan ML-mallit toimivat? Mitkä muuttujat ovat merkittäviä malleissa?

Suuri osa koodista voidaan yleistää datatieteen apuohjelmiksi, joita voidaan käyttää uudelleen eri projekteissa ja auttaa datatieteilijöitä työskentelemään projektin tiettyjen tehtävien parissa ohjatussa tilassa, mikä varmistaa taustalla olevien tehtävien johdonmukaisuuden ja täydellisyyden. Auttaakseen datatieteilijöitä Microsoft julkaisee kaksi datatieteen apuohjelmaa,

  1. Interactive Data Exploration, Analysis and Reporting (IDEAR) ja
  2. Automatisoitu mallinnus ja raportointi (AMAR).

Näitä kahta apuohjelmaa, jotka toimivat CRAN-R:ssä, voidaan käyttää osoitteesta tällä GitHub-sivustolla.

Lue lisää näistä apuohjelmista tätä.

Lisää aiheista: analyysi, Cortana Intelligence Suite, Tietojen etsintä, data Science, koneoppiminen, microsoft