مایکروسافت با استفاده از سیستم هوش مصنوعی چند عامله منحصر به فرد، خانم پک من را شکست داد

نماد زمان خواندن 2 دقیقه خواندن


خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم. نماد راهنمای ابزار

صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب

یک سیستم مبتنی بر هوش مصنوعی که توسط مایکروسافت توسعه یافته است، حداکثر امتیاز ممکن را برای بازی Ms. Pac-Man یعنی 999,990 کسب کرده است. این سیستم توسط تیمی در Maluuba، یک استارت‌آپ یادگیری عمیق کانادایی که در اوایل امسال توسط مایکروسافت خریداری شد، توسعه داده شد. آنها از یک روش تقسیم کن و حکومت کن استفاده کردند که می تواند پیامدهای گسترده ای برای آموزش ماموران هوش مصنوعی برای انجام وظایف پیچیده داشته باشد. این یک دستاورد قابل توجه است زیرا محقق هوش مصنوعی همیشه خانم Pac-Man را در میان سخت ترین ها برای شکستن پیدا کرده است. تیم Maluuba تکنیک مورد استفاده در این سیستم را معماری پاداش هیبریدی می نامند. در زیر به تفصیل در مورد آن بخوانید،

این تکنیک از بیش از 150 عامل استفاده می کند که هر کدام به موازات سایر عوامل برای تسلط بر خانم پک من کار می کردند. به عنوان مثال، برخی از ماموران برای یافتن موفقیت آمیز یک گلوله خاص پاداش دریافت کردند، در حالی که برخی دیگر وظیفه داشتند از راه ارواح دوری کنند. سپس، محققان یک نماینده عالی ایجاد کردند - به نوعی مانند یک مدیر ارشد در یک شرکت - که پیشنهادات همه نمایندگان را می گرفت و از آنها برای تصمیم گیری برای انتقال خانم Pac-Man استفاده می کرد.

نماینده برتر تعداد مامورانی را که از رفتن به یک جهت خاص حمایت می‌کنند، در نظر می‌گیرد، اما به شدتی که می‌خواهند آن حرکت را انجام دهند نیز توجه می‌کند. به عنوان مثال، اگر 100 مامور می خواستند به سمت راست بروند زیرا بهترین مسیر برای گلوله آنها بود، اما سه نفر می خواستند به چپ بروند زیرا یک روح کشنده در سمت راست وجود داشت، به کسانی که متوجه روح شده بودند وزن بیشتری می داد. به سمت چپ.

این تکنیک به ویژه جالب است زیرا بسیاری از وظایف پیچیده که معمولاً برای سیستم‌های یادگیری ماشین بسیار دشوار است، می‌توانند به چندین کار ساده‌تر تقسیم شوند، با پیامدهای قابل توجهی برای میزان و نوع کاری که هوش مصنوعی به زودی قادر به جابجایی خواهد بود.

در مورد این داستان بیشتر بخوانید اینجا کلیک نمایید.

بیشتر در مورد موضوعات: ai, معماری پاداش ترکیبی Maluuba, مایکروسافت, خانم PAC-MAN, تقویت یادگیری