Microsoft ครองตำแหน่งสูงสุดด้วยอันดับสูงสุด 4 กระดานผู้นำ AI
2 นาที. อ่าน
เผยแพร่เมื่อ
อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม
แม้ว่า Microsoft ไม่ได้ทำอะไรที่ฉูดฉาดเหมือน Deepmind ของ Google ที่เอาชนะ Go แต่นักวิจัย AI ของ Microsoft ก็ยังทำได้ดีมาก
ในบล็อกโพสต์ สตีฟ กุกเกนไฮเมอร์ รองประธานบริษัทด้านแพลตฟอร์มนักพัฒนาซอฟต์แวร์ คุยโม้เกี่ยวกับความสำเร็จของไมโครซอฟต์ในสาขานี้ โดยสังเกตว่าบริษัทเป็นผู้นำในการวัดประสิทธิภาพ AI อิสระ XNUMX แบบ พร้อมด้วยโซลูชันที่นำไปใช้ได้มากในการจัดการกับความท้าทายทางธุรกิจที่ซับซ้อนและดำเนินการตามจริง ข้อมูลเชิงลึกให้กับลูกค้าองค์กร
กระดานผู้นำ 4 ได้แก่:
- SQUAD 1.1 (ชุดข้อมูลตอบคำถามของสแตนฟอร์ด): การทดสอบ SQUAD จะขอให้ AI อ่านเอกสารและตอบคำถามที่เกี่ยวข้องกับเรื่องนี้ ในการทดสอบความเข้าใจในการอ่านด้วยเครื่อง (MRC) นี้ AI ของ Microsoft สามารถอ่านและตอบคำถามได้เช่นเดียวกับมนุษย์
- Stanford SQUAD 2.0 การทดสอบความเข้าใจในการอ่าน: ในเดือนมิถุนายน 2018 ได้มีการเผยแพร่ SQuaD เวอร์ชัน 2.0 เพื่อ “ส่งเสริมการพัฒนาระบบการอ่านเพื่อความเข้าใจที่รู้ว่าพวกเขาไม่รู้อะไร” ปัจจุบัน Microsoft ครองตำแหน่ง #1 ใน SQuAD 2.0 และสามในห้าอันดับแรกโดยรวม ในขณะเดียวกันก็รักษาตำแหน่ง #1 ใน SQuaD 1.1 ไว้ด้วย
- ความท้าทายของ Salesforce WikiSQL: สิ่งนี้ใช้ชุดข้อมูลจำนวนมากที่รวบรวมมาจาก Wikipedia ที่เรียกว่า WikiSQL โดยที่ AI จำเป็นต้องใช้ในการตอบคำถามภาษาธรรมชาติจากชุดข้อมูล โดยปกติแล้ว Salesforce จะนำโดย Salesforce เมื่อต้นเดือนนี้ Microsoft ขึ้นเป็นผู้นำในลีดเดอร์บอร์ดของ Salesforce ด้วยแนวทางใหม่ที่เรียกว่า IncSQL การปรับปรุงที่สำคัญ (จาก 81.4% เป็น 87.1%) ในการดำเนินการทดสอบเป็นผลมาจากการทำงานร่วมกันระหว่างนักวิทยาศาสตร์ใน Microsoft Research และในกลุ่มแอปพลิเคชันทางธุรกิจ
- Allen Institute for AI's Reasoning Challenge (ARC): ความท้าทายในการตอบคำถาม ARC ให้ชุดข้อมูลคำถามโดเมนเปิดแบบปรนัยระดับโรงเรียนประถมศึกษา 7,787 ข้อที่ออกแบบมาเพื่อทดสอบแนวทางในการตอบคำถาม แนวทางยอดนิยม การรับรู้คำศัพท์ที่จำเป็น – โปรแกรมอ่านสุนัข (ET-RR) ได้รับการพัฒนาร่วมกันโดยทีมวิจัย Microsoft Dynamics 365 + AI ที่ทำงานร่วมกับนักศึกษาฝึกงานจากมหาวิทยาลัยซานดิเอโก ตำแหน่ง #3 บนกระดานผู้นำคือทีมวิจัยที่แยกจากกันซึ่งประกอบด้วยนักวิจัยจากมหาวิทยาลัยซุนยัดเซ็นและ Microsoft Research Asia
Microsoft ตั้งข้อสังเกตว่าเทคโนโลยีที่พัฒนาขึ้นโดยการมีส่วนร่วมในความท้าทายเหล่านี้กำลังหาทางเข้าสู่ผลิตภัณฑ์ซึ่งจะจัดส่งในเดือนตุลาคม
อ่านเพิ่มเติมเกี่ยวกับการทดสอบและประสิทธิภาพของ Microsoft ในโพสต์บล็อกของสตีฟที่นี่.