Microsoft перемагає пані Pac-Man за допомогою унікальної мультиагентної системи штучного інтелекту

Значок часу читання 2 хв. читати


Читачі допомагають підтримувати MSpoweruser. Ми можемо отримати комісію, якщо ви купуєте через наші посилання. Значок підказки

Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі

Система на основі штучного інтелекту, розроблена Microsoft, набрала максимально можливий бал для гри Ms. Pac-Man, 999,990 XNUMX. Цю систему розробила команда Maluuba, канадського стартапу глибокого навчання, придбаного Microsoft на початку цього року. Вони використали метод «розділяй і володарюй», який може мати широкі наслідки для навчання агентів ШІ виконувати складні завдання. Це значне досягнення, оскільки дослідники штучного інтелекту завжди вважали Ms Pac-Man однією з найскладніших для злому. Команда Maluuba називає техніку, що використовується в цій системі, гібридною архітектурою винагороди. Читайте про це детально нижче,

Ця техніка використовує понад 150 агентів, кожен з яких працював паралельно з іншими агентами, щоб оволодіти пані Пек-Мен. Наприклад, деякі агенти отримували винагороду за успішний пошук однієї конкретної гранули, тоді як інші мали завдання триматися подалі від привидів. Потім дослідники створили головного агента — щось на кшталт старшого менеджера компанії, — який брав пропозиції від усіх агентів і використовував їх, щоб вирішити, куди перемістити пані Пек-Мен.

Головний агент взяв до уваги, скільки агентів виступають за рух у певному напрямку, але він також дивився на інтенсивність, з якою вони хотіли зробити цей крок. Наприклад, якби 100 агентів хотіли піти праворуч, тому що це був найкращий шлях до їхньої кульки, а троє хотіли піти ліворуч, бо праворуч був смертоносний привид, це надало б більшої ваги тим, хто помітив привида та йти ліворуч.

Ця техніка особливо цікава, оскільки багато складних завдань, які зазвичай були б надто складними для систем машинного навчання, можна розбити на кілька окремих простіших завдань, що має суттєві наслідки для обсягу та типу роботи, яку ШІ незабаром зможе замінити.

Прочитайте більше про цю історію тут.

Детальніше про теми: ai, Гібридна архітектура винагород Maluuba, Microsoft, Ms. Pac-Man, навчання