Microsoft anuncia la disponibilidad pública de dos utilidades de ciencia de datos

Icono de tiempo de lectura 1 minuto. leer


Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces. Icono de información sobre herramientas

Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más

cortana-inteligencia-suite

Los científicos de datos pasan una cantidad significativa de tiempo escribiendo código buscando respuestas a las siguientes preguntas la mayor parte del tiempo.

  • ¿Cómo se ven los datos? ¿Cuál es el esquema?
  • ¿Cuál es la calidad de los datos? ¿Cuál es la gravedad de los datos faltantes?
  • ¿Cómo se distribuyen las variables individuales? ¿Necesito hacer una transformación variable?
  • ¿Qué tan relevantes son los datos para la tarea de aprendizaje automático? ¿Qué tan difícil es la tarea de aprendizaje automático en sí?
  • ¿Qué variables son más relevantes para el objetivo de aprendizaje automático?
  • ¿Hay algún patrón de agrupamiento específico en los datos?
  • ¿Cómo funcionarán los modelos ML en los datos? ¿Qué variables son significativas en los modelos?

Gran parte del código se puede generalizar en utilidades de ciencia de datos que se pueden reutilizar en proyectos que ayudan a los científicos de datos a trabajar en tareas específicas en un proyecto en modo guiado, lo que garantiza la coherencia y la integridad de las tareas subyacentes. Para ayudar a los científicos de datos, Microsoft está lanzando dos utilidades de ciencia de datos,

  1. Exploración, análisis e informes de datos interactivos (IDEAR), y
  2. Modelado e Informes Automatizados (AMAR).

Se puede acceder a estas dos utilidades, que se ejecutan en CRAN-R, desde este sitio de GitHub.

Leer más sobre estas utilidades esta página.

Más sobre los temas: análisis, Conjunto de inteligencia de Cortana, Exploración de datos, Data science, máquina de aprendizaje, microsoft