Microsoft ประกาศความพร้อมใช้งานของยูทิลิตี้วิทยาศาสตร์ข้อมูลสองแบบสาธารณะ

หน้าแรก » สีฟ้า

ไอคอนเวลาอ่านหนังสือ 1 นาที. อ่าน

ไอคอนปฏิทิน เผยแพร่เมื่อ ตุลาคม 19, 2016

by ประทีป วิศวาว

เผยแพร่บน ตุลาคม 19, 2016

ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา

นักวิทยาศาสตร์ด้านข้อมูลใช้เวลาส่วนใหญ่ในการเขียนโค้ดเพื่อค้นหาคำตอบสำหรับคำถามด้านล่าง

ข้อมูลมีลักษณะอย่างไร สคีมาคืออะไร?
คุณภาพของข้อมูลเป็นอย่างไร? ข้อมูลที่ขาดหายไปมีความรุนแรงเพียงใด
ตัวแปรแต่ละตัวมีการกระจายอย่างไร? ฉันจำเป็นต้องทำการแปลงตัวแปรหรือไม่
ข้อมูลมีความเกี่ยวข้องกับงานการเรียนรู้ของเครื่องมากน้อยเพียงใด งานแมชชีนเลิร์นนิงเองยากแค่ไหน?
ตัวแปรใดที่เกี่ยวข้องกับเป้าหมายการเรียนรู้ของเครื่องมากที่สุด
มีรูปแบบการจัดกลุ่มเฉพาะในข้อมูลหรือไม่
ตัวแบบ ML บนข้อมูลจะทำงานอย่างไร ตัวแปรใดมีความสำคัญในตัวแบบ

โค้ดส่วนใหญ่สามารถนำไปใช้ในโปรแกรมอรรถประโยชน์ด้านวิทยาศาสตร์ข้อมูลที่สามารถนำมาใช้ซ้ำได้ในโครงการต่างๆ ซึ่งช่วยให้นักวิทยาศาสตร์ข้อมูลทำงานเฉพาะเจาะจงในโครงการในโหมดแนะนำ เพื่อให้มั่นใจว่างานพื้นฐานมีความสอดคล้องและความสมบูรณ์ เพื่อช่วยนักวิทยาศาสตร์ข้อมูล Microsoft ได้เปิดตัวยูทิลิตี้วิทยาศาสตร์ข้อมูลสองรายการ

การสำรวจ การวิเคราะห์ และการรายงานข้อมูลเชิงโต้ตอบ (IDEAR) และ
การสร้างแบบจำลองและการรายงานอัตโนมัติ (AMAR)

ยูทิลิตีทั้งสองนี้ซึ่งทำงานใน CRAN-R สามารถเข้าถึงได้จาก ไซต์ GitHub นี้.

อ่านเพิ่มเติมเกี่ยวกับยูทิลิตี้เหล่านี้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

ข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อต่างๆ: การวิเคราะห์, ชุดปัญญา Cortana, การสำรวจข้อมูล, ข้อมูลวิทยาศาสตร์, เรียนรู้เครื่อง, ไมโครซอฟท์

ประทีป วิศวาว

ผู้เชี่ยวชาญด้านซอฟต์แวร์และบริการ

ประทีพเป็นบัณฑิตสาขาวิทยาการคอมพิวเตอร์และวิศวกรรมศาสตร์ เขายังเป็นหุ้นส่วนนักศึกษาของ Microsoft อีกด้วย ปัจจุบันเขาทำงานในบริษัทไอทีชั้นนำ