מיקרוסופט מנצחת את גברת Pac-Man באמצעות מערכת בינה מלאכותית מרובת סוכנים ייחודית

סמל זמן קריאה 2 דקות לקרוא

סמל לוח השנה פורסם ב יוני 14, 2017

פורסם ב יוני 14, 2017

קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו.

מערכת מבוססת בינה מלאכותית שפותחה על ידי מיקרוסופט השיגה את הציון המקסימלי האפשרי למשחק Ms. Pac-Man, 999,990. מערכת זו פותחה על ידי צוות ב-Maluuba, סטארט-אפ קנדי ללמידה עמוקה שנרכשה על ידי מיקרוסופט מוקדם יותר השנה. הם השתמשו בשיטת הפרד-וכבש שיכולות להיות לה השלכות רחבות על לימוד סוכני AI לבצע משימות מורכבות. זהו הישג משמעותי שכן חוקר בינה מלאכותית תמיד מצא את גברת Pac-Man בין הקשות לפיצוח. צוות Maluuba קורא לטכניקה המשמשת במערכת זו כארכיטקטורת תגמול היברידית. קרא על זה בפירוט למטה,

טכניקה זו משתמשת ביותר מ-150 סוכנים, שכל אחד מהם עבד במקביל לסוכנים האחרים כדי לשלוט בגברת Pac-Man. לדוגמה, סוכנים מסוימים קיבלו תגמול על כך שהם הצליחו למצוא גלולה ספציפית אחת, בעוד שאחרים הוטלו על המשימה להתרחק מרוח רפאים. לאחר מכן, החוקרים יצרו סוכן מוביל - בערך כמו מנהל בכיר בחברה - שלקח הצעות מכל הסוכנים והשתמש בהן כדי להחליט לאן להעביר את גברת פק-מן.

הסוכן הבכיר לקח בחשבון כמה סוכנים דגלו ללכת לכיוון מסוים, אבל הוא גם בחן את האינטנסיביות שבה הם רוצים לעשות את הצעד הזה. לדוגמה, אם 100 סוכנים רצו ללכת ימינה כי זה היה הנתיב הטוב ביותר לכדור שלהם, אבל שלושה רצו ללכת שמאלה כי יש רוח רפאים קטלנית מימין, זה ייתן משקל רב יותר לאלה שהבחינו ברוח הרפאים. פנה שמאלה.

הטכניקה מעניינת במיוחד מכיוון שמשימות מורכבות רבות שבדרך כלל יהיו קשות מדי עבור מערכות למידת מכונה, יכולות להתפרק למספר משימות בודדות יותר פשוטות, עם השלכות משמעותיות על כמות וסוג העבודה שבינה מלאכותית תוכל לעקור בקרוב.

קרא עוד על הסיפור הזה כאן.

עוד על הנושאים: ai, ארכיטקטורת התגמול ההיברידית של Maluuba, מיקרוסופט, גב 'פק-מן, למידה חיזוק

פראדיפ ויסוואב

מומחה תוכנה ושירותים

פראדיפ הוא בוגר מדעי המחשב והנדסה. הוא גם היה שותף סטודנט של מיקרוסופט. כיום הוא עובד בחברת IT מובילה.