Microsoft побеждает г-жу Pac-Man, используя уникальную многоагентную систему искусственного интеллекта

Значок времени чтения 2 минута. читать

Значок календаря Опубликовано 14 июня 2017

Опубликован в 14 июня 2017

Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам.

Система на основе искусственного интеллекта, разработанная Microsoft, набрала максимально возможный балл в игре Ms. Pac-Man — 999,990 XNUMX. Эта система была разработана командой Maluuba, канадского стартапа в области глубокого обучения, приобретенного Microsoft в начале этого года. Они использовали метод «разделяй и властвуй», который может иметь большое значение для обучения агентов ИИ выполнению сложных задач. Это значительное достижение, поскольку исследователи ИИ всегда считали Ms Pac-Man одной из самых сложных для взлома. Команда Maluuba называет метод, используемый в этой системе, гибридной архитектурой вознаграждения. Подробнее об этом читайте ниже,

В этой технике используется более 150 агентов, каждый из которых работал параллельно с другими агентами, чтобы освоить мисс Пакман. Например, некоторые агенты получали вознаграждение за успешное обнаружение одной конкретной гранулы, в то время как другим было поручено держаться подальше от призраков. Затем исследователи создали главного агента — что-то вроде старшего менеджера в компании, — который принимал предложения от всех агентов и использовал их, чтобы решить, куда переместить г-жу Пакман.

Ведущий агент учитывал, сколько агентов выступало за движение в определенном направлении, а также интенсивность, с которой они хотели сделать это движение. Например, если 100 агентов хотели пойти направо, потому что это был лучший путь к их шарику, но трое хотели пойти налево, потому что справа был смертоносный призрак, это придало бы больший вес тем, кто заметил призрак и идите налево.

Этот метод особенно интересен, потому что многие сложные задачи, которые обычно были бы слишком сложными для систем машинного обучения, могут быть разбиты на несколько отдельных более простых задач, что имеет значительные последствия для объема и типа работы, которую ИИ вскоре сможет заменить.

Подробнее об этой истории здесь.

Подробнее о темах: ai, Гибридная архитектура вознаграждения Maluuba, Microsoft, Ms. Pac-Man, усиление обучения

Прадип Вишвав

Эксперт по программному обеспечению и услугам

Прадип — выпускник компьютерных наук и инженерии. Он также был студенческим партнером Microsoft. В настоящее время работает в ведущей IT-компании.