Microsoft оголошує про публічну доступність двох утиліт для науки про дані

Значок часу читання 1 хв. читати


Читачі допомагають підтримувати MSpoweruser. Ми можемо отримати комісію, якщо ви купуєте через наші посилання. Значок підказки

Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі

cortana-intelligence-suite

Науковці даних витрачають значну кількість часу на написання коду, шукаючи відповіді на запитання, наведені нижче.

  • Як виглядають дані? Яка схема?
  • Яка якість даних? Яка серйозність відсутніх даних?
  • Як розподіляються окремі змінні? Чи потрібно мені виконувати перетворення змінних?
  • Наскільки дані відповідають задачі машинного навчання? Наскільки складним є саме завдання машинного навчання?
  • Які змінні є найбільш релевантними для мети машинного навчання?
  • Чи є в даних певний шаблон кластеризації?
  • Як працюватимуть моделі ML на даних? Які змінні є значущими в моделях?

Значну частину коду можна узагальнити в утиліти для обробки даних, які можна повторно використовувати в проектах, допомагаючи науковцям працювати над конкретними завданнями в проекті в керованому режимі, забезпечуючи послідовність і повноту базових завдань. Щоб допомогти фахівцям обробки даних, Microsoft випускає дві утиліти для обробки даних,

  1. Інтерактивне дослідження даних, аналіз і звітність (IDEAR) і
  2. Автоматизоване моделювання та звітність (AMAR).

Ці дві утиліти, які працюють у CRAN-R, можна отримати з цей сайт GitHub.

Докладніше про ці утиліти тут.

Детальніше про теми: аналіз, Cortana Intelligence Suite, Дослідження даних, наука даних, навчання за допомогою машини, Microsoft