Microsoft anuncia la disponibilidad pública de dos utilidades de ciencia de datos

Icono de tiempo de lectura 1 minuto. leer

Icono de calendario Publicado el 19 de Octubre de 2016

Publicado en 19 de Octubre de 2016

Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces.

Los científicos de datos pasan una cantidad significativa de tiempo escribiendo código buscando respuestas a las siguientes preguntas la mayor parte del tiempo.

¿Cómo se ven los datos? ¿Cuál es el esquema?
¿Cuál es la calidad de los datos? ¿Cuál es la gravedad de los datos faltantes?
¿Cómo se distribuyen las variables individuales? ¿Necesito hacer una transformación variable?
¿Qué tan relevantes son los datos para la tarea de aprendizaje automático? ¿Qué tan difícil es la tarea de aprendizaje automático en sí?
¿Qué variables son más relevantes para el objetivo de aprendizaje automático?
¿Hay algún patrón de agrupamiento específico en los datos?
¿Cómo funcionarán los modelos ML en los datos? ¿Qué variables son significativas en los modelos?

Gran parte del código se puede generalizar en utilidades de ciencia de datos que se pueden reutilizar en proyectos que ayudan a los científicos de datos a trabajar en tareas específicas en un proyecto en modo guiado, lo que garantiza la coherencia y la integridad de las tareas subyacentes. Para ayudar a los científicos de datos, Microsoft está lanzando dos utilidades de ciencia de datos,

Exploración, análisis e informes de datos interactivos (IDEAR), y
Modelado e Informes Automatizados (AMAR).

Se puede acceder a estas dos utilidades, que se ejecutan en CRAN-R, desde este sitio de GitHub.

Leer más sobre estas utilidades esta página.

Más sobre los temas: análisis, Conjunto de inteligencia de Cortana, Exploración de datos, Data science, máquina de aprendizaje, microsoft

Pradeep Viswav

Experto en Software y Servicios

Pradeep es un graduado en ingeniería y ciencias de la computación. También fue socio estudiantil de Microsoft. Actualmente trabaja en una empresa líder en TI.