Η Microsoft Research εργάζεται σε μια τεχνητή νοημοσύνη που μπορεί να πει την ιστορία των φωτογραφιών των διακοπών σας

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

ταξίδι στην παραλία

Η τεχνητή νοημοσύνη που μπορεί να περιγράφει εικόνες λειτουργεί ήδη στο διαδίκτυο, προσθέτοντας λεζάντες σε φωτογραφίες στο Facebook για παράδειγμα. Τώρα η Microsoft Research πηγαίνει την τεχνολογία στο επόμενο επίπεδο, ζητώντας από το AI της να πει την ιστορία μιας σειράς εικόνων.

Για παράδειγμα, ενώ ένα πρόγραμμα δημιουργίας λεζάντας εικόνων μπορεί να πάρει πέντε εικόνες και να πει: «Αυτή είναι μια εικόνα μιας οικογένειας. Αυτή είναι μια εικόνα μιας τούρτας. Αυτή είναι μια εικόνα ενός σκύλου. Αυτή είναι μια εικόνα μιας παραλίας», το πρόγραμμα αφήγησης μπορεί να πάρει τις ίδιες εικόνες και να πει, «Η οικογένεια μαζεύτηκε για μια μαγειρική. είχαν πολύ νόστιμο φαγητό. ο σκύλος ήταν χαρούμενος που ήταν εκεί. πέρασαν υπέροχα στην παραλία. έκαναν ακόμη και μια βουτιά στο νερό».

Στο μέλλον, η ηλεκτρονική αφήγηση ιστοριών θα μπορούσε να βοηθήσει τους ανθρώπους να δημιουργήσουν αυτόματα ιστορίες για slideshows των εικόνων που ανεβάζουν στα μέσα κοινωνικής δικτύωσης, είπε ο Mitchell. «Θα βοηθούσατε τους ανθρώπους να μοιράζονται τις εμπειρίες τους, ενώ θα μειώνατε τη βαρετή δουλειά που ορισμένοι άνθρωποι βρίσκουν αρκετά κουραστική», είπε. Η ηλεκτρονική αφήγηση ιστοριών «μπορεί επίσης να βοηθήσει άτομα με προβλήματα όρασης, να ανοίξουν εικόνες για άτομα που δεν μπορούν να τις δουν».

«Ο στόχος είναι να βοηθήσουμε να δώσουμε στο AI περισσότερη νοημοσύνη σαν ανθρώπινη, να το βοηθήσουμε να κατανοήσει τα πράγματα σε πιο αφηρημένο επίπεδο – τι σημαίνει να είσαι διασκεδαστικός ή ανατριχιαστικός ή περίεργος ή ενδιαφέρον», δήλωσε η ανώτερη συγγραφέας της μελέτης Μάργκαρετ Μίτσελ, επιστήμονας υπολογιστών στο Έρευνα της Microsoft. «Οι άνθρωποι μεταδίδουν ιστορίες για αιώνες, χρησιμοποιώντας τις για να μεταφέρουν τα ήθη, τις στρατηγικές και τη σοφία μας. Με την εστίασή μας στην αφήγηση, ελπίζουμε να βοηθήσουμε τους AI να κατανοήσουν τις ανθρώπινες έννοιες με τρόπο που είναι πολύ ασφαλής και επωφελής για την ανθρωπότητα, αντί να τη διδάξουμε πώς να νικήσει την ανθρωπότητα».

Εάν η τεχνητή νοημοσύνη μάθει ποτέ να λέει ιστορίες με βάση σειρές εικόνων, "αυτό είναι ένα σκαλοπάτι για να κάνουμε το ίδιο για το βίντεο", είπε ο Μίτσελ. «Αυτό θα μπορούσε να βοηθήσει στην παροχή ενδιαφέρουσες εφαρμογές. Για παράδειγμα, για τις κάμερες ασφαλείας, μπορεί να θέλετε απλώς μια περίληψη οποιουδήποτε αξιοσημείωτου ή θα μπορούσατε να κάνετε αυτόματα ζωντανά συμβάντα tweet», είπε.

Οι ερευνητές θα παρουσιάσουν τα ευρήματά τους στο Σαν Ντιέγκο στην ετήσια συνάντηση του Βορειοαμερικανικού Κεφαλαίου της Ένωσης Υπολογιστικής Γλωσσολογίας αργότερα αυτόν τον μήνα.

Περισσότερα για τα θέματα: ai, έρευνα microsoft