Microsoft anuncia a disponibilidade pública de dois utilitários de ciência de dados

Ícone de tempo de leitura 1 minutos. ler

Ícone do calendário Publicado em 19 de outubro de 2016

publicado em 19 de outubro de 2016

Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links.

Os cientistas de dados gastam uma quantidade significativa de tempo escrevendo código buscando respostas para as perguntas abaixo na maioria das vezes.

Como são os dados? Qual é o esquema?
Qual é a qualidade dos dados? Qual é a gravidade dos dados ausentes?
Como as variáveis individuais são distribuídas? Preciso fazer transformação de variável?
Qual é a relevância dos dados para a tarefa de aprendizado de máquina? Quão difícil é a tarefa de aprendizado de máquina em si?
Quais variáveis são mais relevantes para o destino de aprendizado de máquina?
Existe algum padrão de agrupamento específico nos dados?
Como os modelos de ML nos dados serão executados? Quais variáveis são significativas nos modelos?

Grande parte do código pode ser generalizado em utilitários de ciência de dados que podem ser reutilizados em projetos, ajudando os cientistas de dados a trabalhar em tarefas específicas em um projeto de modo guiado, garantindo consistência e integridade das tarefas subjacentes. Para ajudar os cientistas de dados, a Microsoft está lançando dois utilitários de ciência de dados,

Exploração, Análise e Relatórios Interativos de Dados (IDEAR), e
Modelagem e Relatórios Automatizados (AMAR).

Esses dois utilitários, que são executados no CRAN-R, podem ser acessados de este site do GitHub.

Leia mais sobre esses utilitários SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Mais sobre os tópicos: análise, Pacote de inteligência da Cortana, Exploração de Dados, Ciência dados, aprendizado de máquina, microsoft

Pradeep Viswav

Especialista em Software e Serviços

Pradeep é graduado em Ciência da Computação e Engenharia. Ele também foi um parceiro estudantil da Microsoft. Atualmente, ele trabalha em uma empresa líder de TI.