Microsoft ilmoittaa kahden datatieteen apuohjelman julkisesta saatavuudesta
1 min. lukea
Julkaistu
Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää
Datatieteilijät käyttävät paljon aikaa koodin kirjoittamiseen etsiessään vastauksia alla oleviin kysymyksiin suurimman osan ajasta.
- Miltä data näyttää? Mikä on kaava?
- Mikä on tietojen laatu? Mikä on puuttuvien tietojen vakavuus?
- Miten yksittäiset muuttujat jakautuvat? Pitääkö minun tehdä muuttujamuunnos?
- Kuinka relevanttia data on koneoppimistehtävän kannalta? Kuinka vaikea itse koneoppimistehtävä on?
- Mitkä muuttujat ovat oleellisimmat koneoppimistavoitteen kannalta?
- Onko tiedoissa tiettyä klusterointimallia?
- Kuinka datan ML-mallit toimivat? Mitkä muuttujat ovat merkittäviä malleissa?
Suuri osa koodista voidaan yleistää datatieteen apuohjelmiksi, joita voidaan käyttää uudelleen eri projekteissa ja auttaa datatieteilijöitä työskentelemään projektin tiettyjen tehtävien parissa ohjatussa tilassa, mikä varmistaa taustalla olevien tehtävien johdonmukaisuuden ja täydellisyyden. Auttaakseen datatieteilijöitä Microsoft julkaisee kaksi datatieteen apuohjelmaa,
- Interactive Data Exploration, Analysis and Reporting (IDEAR) ja
- Automatisoitu mallinnus ja raportointi (AMAR).
Näitä kahta apuohjelmaa, jotka toimivat CRAN-R:ssä, voidaan käyttää osoitteesta tällä GitHub-sivustolla.
Lue lisää näistä apuohjelmista tätä.