מיקרוסופט מנצחת את גברת Pac-Man באמצעות מערכת בינה מלאכותית מרובת סוכנים ייחודית

סמל זמן קריאה 2 דקות לקרוא


קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו. סמל טיפים

קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קראו עוד

מערכת מבוססת בינה מלאכותית שפותחה על ידי מיקרוסופט השיגה את הציון המקסימלי האפשרי למשחק Ms. Pac-Man, 999,990. מערכת זו פותחה על ידי צוות ב-Maluuba, סטארט-אפ קנדי ​​ללמידה עמוקה שנרכשה על ידי מיקרוסופט מוקדם יותר השנה. הם השתמשו בשיטת הפרד-וכבש שיכולות להיות לה השלכות רחבות על לימוד סוכני AI לבצע משימות מורכבות. זהו הישג משמעותי שכן חוקר בינה מלאכותית תמיד מצא את גברת Pac-Man בין הקשות לפיצוח. צוות Maluuba קורא לטכניקה המשמשת במערכת זו כארכיטקטורת תגמול היברידית. קרא על זה בפירוט למטה,

טכניקה זו משתמשת ביותר מ-150 סוכנים, שכל אחד מהם עבד במקביל לסוכנים האחרים כדי לשלוט בגברת Pac-Man. לדוגמה, סוכנים מסוימים קיבלו תגמול על כך שהם הצליחו למצוא גלולה ספציפית אחת, בעוד שאחרים הוטלו על המשימה להתרחק מרוח רפאים. לאחר מכן, החוקרים יצרו סוכן מוביל - בערך כמו מנהל בכיר בחברה - שלקח הצעות מכל הסוכנים והשתמש בהן כדי להחליט לאן להעביר את גברת פק-מן.

הסוכן הבכיר לקח בחשבון כמה סוכנים דגלו ללכת לכיוון מסוים, אבל הוא גם בחן את האינטנסיביות שבה הם רוצים לעשות את הצעד הזה. לדוגמה, אם 100 סוכנים רצו ללכת ימינה כי זה היה הנתיב הטוב ביותר לכדור שלהם, אבל שלושה רצו ללכת שמאלה כי יש רוח רפאים קטלנית מימין, זה ייתן משקל רב יותר לאלה שהבחינו ברוח הרפאים. פנה שמאלה.

הטכניקה מעניינת במיוחד מכיוון שמשימות מורכבות רבות שבדרך כלל יהיו קשות מדי עבור מערכות למידת מכונה, יכולות להתפרק למספר משימות בודדות יותר פשוטות, עם השלכות משמעותיות על כמות וסוג העבודה שבינה מלאכותית תוכל לעקור בקרוב.

קרא עוד על הסיפור הזה כאן.

עוד על הנושאים: ai, ארכיטקטורת התגמול ההיברידית של Maluuba, מיקרוסופט, גב 'פק-מן, למידה חיזוק