Microsoft anuncia a disponibilidade pública de dois utilitários de ciência de dados

Ícone de tempo de leitura 1 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

suíte de inteligência cortana

Os cientistas de dados gastam uma quantidade significativa de tempo escrevendo código buscando respostas para as perguntas abaixo na maioria das vezes.

  • Como são os dados? Qual é o esquema?
  • Qual é a qualidade dos dados? Qual é a gravidade dos dados ausentes?
  • Como as variáveis ​​individuais são distribuídas? Preciso fazer transformação de variável?
  • Qual é a relevância dos dados para a tarefa de aprendizado de máquina? Quão difícil é a tarefa de aprendizado de máquina em si?
  • Quais variáveis ​​são mais relevantes para o destino de aprendizado de máquina?
  • Existe algum padrão de agrupamento específico nos dados?
  • Como os modelos de ML nos dados serão executados? Quais variáveis ​​são significativas nos modelos?

Grande parte do código pode ser generalizado em utilitários de ciência de dados que podem ser reutilizados em projetos, ajudando os cientistas de dados a trabalhar em tarefas específicas em um projeto de modo guiado, garantindo consistência e integridade das tarefas subjacentes. Para ajudar os cientistas de dados, a Microsoft está lançando dois utilitários de ciência de dados,

  1. Exploração, Análise e Relatórios Interativos de Dados (IDEAR), e
  2. Modelagem e Relatórios Automatizados (AMAR).

Esses dois utilitários, que são executados no CRAN-R, podem ser acessados ​​de este site do GitHub.

Leia mais sobre esses utilitários SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Mais sobre os tópicos: análise, Pacote de inteligência da Cortana, Exploração de Dados, Ciência dados, aprendizado de máquina, microsoft