Microsoft는 두 가지 데이터 과학 유틸리티의 공개 가용성을 발표했습니다.

독서 시간 아이콘 1 분. 읽다


독자들은 MSpoweruser를 지원하는 데 도움을 줍니다. 당사의 링크를 통해 구매하시면 수수료를 받을 수 있습니다. 툴팁 아이콘

공개 페이지를 읽고 MSPoweruser가 편집팀을 유지하는 데 어떻게 도움을 줄 수 있는지 알아보세요. 자세히 보기

cortana 인텔리전스 제품군

데이터 과학자들은 대부분의 시간에 아래 질문에 대한 답을 찾기 위해 코드를 작성하는 데 상당한 시간을 할애합니다.

  • 데이터는 어떻게 생겼나요? 스키마는 무엇입니까?
  • 데이터의 품질은 어떻습니까? 누락된 데이터의 심각도는 무엇입니까?
  • 개별 변수는 어떻게 분포되어 있습니까? 변수 변환을 수행해야 합니까?
  • 데이터가 기계 학습 작업과 얼마나 관련이 있습니까? 머신 러닝 작업 자체가 얼마나 어려운가요?
  • 기계 학습 대상과 가장 관련성이 높은 변수는 무엇입니까?
  • 데이터에 특정 클러스터링 패턴이 있습니까?
  • 데이터에 대한 ML 모델의 성능은 어떻습니까? 모델에서 어떤 변수가 중요합니까?

코드의 대부분은 데이터 과학자가 가이드 모드에서 프로젝트의 특정 작업을 수행하는 데 도움이 되는 여러 프로젝트에서 재사용할 수 있는 데이터 과학 유틸리티로 일반화되어 기본 작업의 일관성과 완전성을 보장할 수 있습니다. 데이터 과학자를 돕기 위해 Microsoft는 두 가지 데이터 과학 유틸리티를 출시합니다.

  1. IDEAR(대화형 데이터 탐색, 분석 및 보고) 및
  2. AMAR(자동 모델링 및 보고).

CRAN-R에서 실행되는 이 두 유틸리티는 다음에서 액세스할 수 있습니다. 이 GitHub 사이트.

이러한 유틸리티에 대해 자세히 알아보기 여기에서 지금 확인해 보세요..

주제에 대한 추가 정보: 분석, 코타나 인텔리전스 스위트, 데이터 탐색, 데이터 과학, 기계 학습, 마이크로 소프트