Microsoft ประกาศความพร้อมใช้งานของยูทิลิตี้วิทยาศาสตร์ข้อมูลสองแบบสาธารณะ
1 นาที. อ่าน
เผยแพร่เมื่อ
อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม
นักวิทยาศาสตร์ด้านข้อมูลใช้เวลาส่วนใหญ่ในการเขียนโค้ดเพื่อค้นหาคำตอบสำหรับคำถามด้านล่าง
- ข้อมูลมีลักษณะอย่างไร สคีมาคืออะไร?
- คุณภาพของข้อมูลเป็นอย่างไร? ข้อมูลที่ขาดหายไปมีความรุนแรงเพียงใด
- ตัวแปรแต่ละตัวมีการกระจายอย่างไร? ฉันจำเป็นต้องทำการแปลงตัวแปรหรือไม่
- ข้อมูลมีความเกี่ยวข้องกับงานการเรียนรู้ของเครื่องมากน้อยเพียงใด งานแมชชีนเลิร์นนิงเองยากแค่ไหน?
- ตัวแปรใดที่เกี่ยวข้องกับเป้าหมายการเรียนรู้ของเครื่องมากที่สุด
- มีรูปแบบการจัดกลุ่มเฉพาะในข้อมูลหรือไม่
- ตัวแบบ ML บนข้อมูลจะทำงานอย่างไร ตัวแปรใดมีความสำคัญในตัวแบบ
โค้ดส่วนใหญ่สามารถนำไปใช้ในโปรแกรมอรรถประโยชน์ด้านวิทยาศาสตร์ข้อมูลที่สามารถนำมาใช้ซ้ำได้ในโครงการต่างๆ ซึ่งช่วยให้นักวิทยาศาสตร์ข้อมูลทำงานเฉพาะเจาะจงในโครงการในโหมดแนะนำ เพื่อให้มั่นใจว่างานพื้นฐานมีความสอดคล้องและความสมบูรณ์ เพื่อช่วยนักวิทยาศาสตร์ข้อมูล Microsoft ได้เปิดตัวยูทิลิตี้วิทยาศาสตร์ข้อมูลสองรายการ
- การสำรวจ การวิเคราะห์ และการรายงานข้อมูลเชิงโต้ตอบ (IDEAR) และ
- การสร้างแบบจำลองและการรายงานอัตโนมัติ (AMAR)
ยูทิลิตีทั้งสองนี้ซึ่งทำงานใน CRAN-R สามารถเข้าถึงได้จาก ไซต์ GitHub นี้.
อ่านเพิ่มเติมเกี่ยวกับยูทิลิตี้เหล่านี้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.