Microsoft는 두 가지 데이터 과학 유틸리티의 공개 가용성을 발표했습니다.

홈 » 하늘빛

독서 시간 아이콘 1 분. 읽다

달력 아이콘 에 게시됨 2016 년 10 월 19 일

by 프라딥 비스와브

에 게시 2016 년 10 월 19 일

독자들은 MSpoweruser를 지원하는 데 도움을 줍니다. 당사의 링크를 통해 구매하시면 수수료를 받을 수 있습니다.

데이터 과학자들은 대부분의 시간에 아래 질문에 대한 답을 찾기 위해 코드를 작성하는 데 상당한 시간을 할애합니다.

데이터는 어떻게 생겼나요? 스키마는 무엇입니까?
데이터의 품질은 어떻습니까? 누락된 데이터의 심각도는 무엇입니까?
개별 변수는 어떻게 분포되어 있습니까? 변수 변환을 수행해야 합니까?
데이터가 기계 학습 작업과 얼마나 관련이 있습니까? 머신 러닝 작업 자체가 얼마나 어려운가요?
기계 학습 대상과 가장 관련성이 높은 변수는 무엇입니까?
데이터에 특정 클러스터링 패턴이 있습니까?
데이터에 대한 ML 모델의 성능은 어떻습니까? 모델에서 어떤 변수가 중요합니까?

코드의 대부분은 데이터 과학자가 가이드 모드에서 프로젝트의 특정 작업을 수행하는 데 도움이 되는 여러 프로젝트에서 재사용할 수 있는 데이터 과학 유틸리티로 일반화되어 기본 작업의 일관성과 완전성을 보장할 수 있습니다. 데이터 과학자를 돕기 위해 Microsoft는 두 가지 데이터 과학 유틸리티를 출시합니다.

IDEAR(대화형 데이터 탐색, 분석 및 보고) 및
AMAR(자동 모델링 및 보고).

CRAN-R에서 실행되는 이 두 유틸리티는 다음에서 액세스할 수 있습니다. 이 GitHub 사이트.

이러한 유틸리티에 대해 자세히 알아보기 여기에서 지금 확인해 보세요..

주제에 대한 추가 정보: 분석, 코타나 인텔리전스 스위트, 데이터 탐색, 데이터 과학, 기계 학습, 마이크로 소프트

프라딥 비스와브

소프트웨어 및 서비스 전문가

Pradeep은 컴퓨터 과학 및 공학 졸업생입니다. 그는 또한 Microsoft 학생 파트너이기도 했습니다. 그는 현재 선도적인 IT 기업에 근무하고 있습니다.