Η Microsoft κερδίζει την κυρία Pac-Man χρησιμοποιώντας μοναδικό σύστημα AI πολλαπλών πρακτόρων

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Ένα σύστημα βασισμένο σε τεχνητή νοημοσύνη που αναπτύχθηκε από τη Microsoft πέτυχε τη μέγιστη δυνατή βαθμολογία για το παιχνίδι Ms. Pac-Man, 999,990. Αυτό το σύστημα αναπτύχθηκε από μια ομάδα της Maluuba, μια καναδική startup βαθιάς μάθησης που εξαγοράστηκε από τη Microsoft νωρίτερα φέτος. Χρησιμοποίησαν μια μέθοδο διαίρει και βασίλευε που θα μπορούσε να έχει ευρείες επιπτώσεις στη διδασκαλία πρακτόρων τεχνητής νοημοσύνης να κάνουν περίπλοκες εργασίες. Αυτό είναι ένα σημαντικό επίτευγμα δεδομένου ότι ο ερευνητής της τεχνητής νοημοσύνης πάντα έβρισκε την κα Pac-Man μεταξύ των πιο δύσκολων. Η ομάδα Maluuba αποκαλεί την τεχνική που χρησιμοποιείται σε αυτό το σύστημα ως Hybrid Reward Architecture. Διαβάστε σχετικά αναλυτικά παρακάτω,

Αυτή η τεχνική χρησιμοποιεί περισσότερους από 150 πράκτορες, καθένας από τους οποίους εργάστηκε παράλληλα με τους άλλους πράκτορες για να κυριαρχήσει στην κα Pac-Man. Για παράδειγμα, ορισμένοι πράκτορες ανταμείφθηκαν για την επιτυχή εύρεση ενός συγκεκριμένου pellet, ενώ άλλοι επιφορτίστηκαν με το να μείνουν μακριά από τα φαντάσματα. Στη συνέχεια, οι ερευνητές δημιούργησαν έναν κορυφαίο πράκτορα –κάπως σαν ανώτερος διευθυντής σε μια εταιρεία– που έλαβε προτάσεις από όλους τους πράκτορες και τις χρησιμοποίησε για να αποφασίσει πού θα μετακινήσει την κα Pac-Man.

Ο κορυφαίος πράκτορας έλαβε υπόψη του πόσοι πράκτορες υποστήριζαν να πάει προς μια συγκεκριμένη κατεύθυνση, αλλά εξέτασε επίσης την ένταση με την οποία ήθελαν να κάνουν αυτή την κίνηση. Για παράδειγμα, αν 100 πράκτορες ήθελαν να πάνε δεξιά επειδή αυτό ήταν το καλύτερο μονοπάτι για το πέλλετ τους, αλλά τρεις ήθελαν να πάνε αριστερά επειδή υπήρχε ένα θανατηφόρο φάντασμα στα δεξιά, θα έδινε μεγαλύτερη βαρύτητα σε αυτούς που είχαν προσέξει το φάντασμα και πήγαινε αριστερά.

Η τεχνική είναι ιδιαίτερα ενδιαφέρουσα επειδή πολλές σύνθετες εργασίες που κανονικά θα ήταν πολύ δύσκολο να αναλάβουν τα συστήματα μηχανικής μάθησης μπορούν να αναλυθούν σε πολλαπλές μεμονωμένες απλούστερες εργασίες, με σημαντικές επιπτώσεις για την ποσότητα και το είδος της εργασίας που η τεχνητή νοημοσύνη σύντομα θα μπορεί να αντικαταστήσει.

Διαβάστε περισσότερα για αυτήν την ιστορία εδώ.

Περισσότερα για τα θέματα: ai, Η υβριδική αρχιτεκτονική επιβράβευσης του Maluuba, microsoft, Κα Pac-Man, ενίσχυση μάθησης