Microsoft เอาชนะ Ms. Pac-Man โดยใช้ระบบ AI แบบหลายเอเจนต์ที่ไม่เหมือนใคร

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน


ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา ไอคอนคำแนะนำเครื่องมือ

อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม

ระบบที่ใช้ปัญญาประดิษฐ์ที่พัฒนาโดย Microsoft ได้รับคะแนนสูงสุดสำหรับเกม Ms. Pac-Man ที่ 999,990 ระบบนี้ได้รับการพัฒนาโดยทีมงานของ Maluuba ซึ่งเป็นบริษัทสตาร์ทอัพด้านการเรียนรู้เชิงลึกของแคนาดาที่ Microsoft ซื้อมาเมื่อต้นปีนี้ พวกเขาใช้วิธีการแบ่งแยกและพิชิตที่อาจมีความหมายกว้างๆ ในการสอนตัวแทน AI ให้ทำงานที่ซับซ้อน นี่เป็นความสำเร็จครั้งสำคัญ เนื่องจากนักวิจัย AI มักพบว่า Ms. Pac-Man เป็นหนึ่งในผู้ที่เจาะระบบได้ยากที่สุด ทีม Maluuba เรียกเทคนิคที่ใช้ในระบบนี้ว่า Hybrid Reward Architecture อ่านรายละเอียดด้านล่าง

เทคนิคนี้ใช้ตัวแทนมากกว่า 150 ราย ซึ่งแต่ละอย่างทำงานควบคู่ไปกับตัวแทนอื่นๆ เพื่อให้คุณเป็นผู้เชี่ยวชาญของ Pac-Man ตัวอย่างเช่น เจ้าหน้าที่บางคนได้รับรางวัลสำหรับการค้นหาเม็ดยาบางชนิดที่ประสบความสำเร็จ ในขณะที่คนอื่นๆ ได้รับมอบหมายให้อยู่ห่างจากผี จากนั้นนักวิจัยได้สร้างตัวแทนระดับแนวหน้า ซึ่งคล้ายกับผู้จัดการอาวุโสของบริษัท ซึ่งรับคำแนะนำจากตัวแทนทั้งหมดและใช้พวกเขาเพื่อตัดสินใจว่าจะย้ายนางสาวแพคแมนไปที่ใด

เจ้าหน้าที่ระดับสูงคำนึงถึงจำนวนตัวแทนที่สนับสนุนให้ไปในทิศทางใดทิศทางหนึ่ง แต่ก็พิจารณาถึงความเข้มข้นที่พวกเขาต้องการจะทำการย้ายนั้นด้วย ตัวอย่างเช่น หากเจ้าหน้าที่ 100 คนต้องการไปทางขวาเพราะนั่นเป็นเส้นทางที่ดีที่สุดไปยังเม็ดยาของพวกเขา แต่สามคนต้องการไปทางซ้ายเพราะมีผีร้ายอยู่ทางขวา มันจะเพิ่มน้ำหนักให้กับผู้ที่สังเกตเห็นผีและ ไปทางซ้าย

เทคนิคนี้น่าสนใจเป็นพิเศษเพราะงานที่ซับซ้อนหลายอย่างซึ่งโดยปกติยากเกินไปสำหรับระบบการเรียนรู้ด้วยเครื่องสามารถแบ่งออกเป็นงานที่เรียบง่ายกว่าหลายงานโดยมีผลกระทบอย่างมีนัยสำคัญสำหรับปริมาณและประเภทของงาน AI จะสามารถแทนที่ได้ในไม่ช้า

อ่านเพิ่มเติมเกี่ยวกับเรื่องนี้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

ข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อต่างๆ: ai, สถาปัตยกรรมรางวัลไฮบริดของ Maluuba, ไมโครซอฟท์, นางสาว Pac-Man, การเรียนรู้การเสริมแรง