Microsoft mengumumkan ketersediaan publik dari dua utilitas ilmu data

Ikon waktu membaca 1 menit Baca


Pembaca membantu dukungan MSpoweruser. Kami mungkin mendapat komisi jika Anda membeli melalui tautan kami. Ikon Keterangan Alat

Baca halaman pengungkapan kami untuk mengetahui bagaimana Anda dapat membantu MSPoweruser mempertahankan tim editorial Baca lebih lanjut

cortana-intelijen-suite

Ilmuwan data menghabiskan banyak waktu menulis kode untuk mencari jawaban atas pertanyaan di bawah ini sebagian besar waktu.

  • Seperti apa tampilan datanya? Apa skemanya?
  • Bagaimana kualitas datanya? Apa tingkat keparahan data yang hilang?
  • Bagaimana variabel individu didistribusikan? Apakah saya perlu melakukan transformasi variabel?
  • Seberapa relevan data dengan tugas pembelajaran mesin? Seberapa sulit tugas pembelajaran mesin itu sendiri?
  • Variabel mana yang paling relevan dengan target pembelajaran mesin?
  • Apakah ada pola pengelompokan tertentu dalam data?
  • Bagaimana performa model ML pada data? Variabel mana yang signifikan dalam model?

Sebagian besar kode dapat digeneralisasi ke dalam utilitas ilmu data yang dapat digunakan kembali di seluruh proyek untuk membantu ilmuwan data mengerjakan tugas tertentu dalam proyek dalam mode terpandu, memastikan konsistensi dan kelengkapan tugas yang mendasarinya. Untuk membantu ilmuwan data, Microsoft merilis dua utilitas ilmu data,

  1. Eksplorasi, Analisis, dan Pelaporan Data Interaktif (IDEAR), dan
  2. Pemodelan dan Pelaporan Otomatis (AMAR).

Kedua utilitas ini, yang berjalan di CRAN-R, dapat diakses dari: situs GitHub ini.

Baca lebih lanjut tentang utilitas ini di sini.

Lebih lanjut tentang topik: analisis, Suite Intelijen Cortana, Eksplorasi Data, Ilmu Data, Mesin belajar, microsoft