Το νέο εργαλείο AI της Microsoft κάνει τη φαντασία σας πραγματικότητα

Εικονίδιο ώρας ανάγνωσης 3 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Φανταστείτε ότι μπορείτε να δημιουργήσετε φωτογραφίες υψηλής ποιότητας απλά να τις περιγράφετε σε έναν υπολογιστή. Αυτό το σενάριο επιστημονικής φαντασίας είναι πλέον πραγματικότητα, χάρη στο νέο εργαλείο AI της Microsoft.

Το Drawing Bot δημιούργησε την παραπάνω εικόνα απλά από την περιγραφή του "ένα πουλί με κίτρινο σώμα, μαύρα φτερά και κοντό ράμφος,χρησιμοποιώντας μια νέα τεχνική όπου η τεχνητή νοημοσύνη δίνει μεγάλη προσοχή σε μεμονωμένες λέξεις όταν δημιουργεί εικόνες από περιγραφές κειμένου που μοιάζουν με λεζάντες, με αποτέλεσμα την τριπλάσια ώθηση στην ποιότητα της εικόνας σε σύγκριση με άλλες τεχνικές δημιουργίας κειμένου σε εικόνα.

Το ρομπότ μπορεί να κάνει περισσότερα από τα πουλιά, καθώς μπορεί να σχεδιάσει τα πάντα, από συνηθισμένες ποιμενικές σκηνές, όπως βόσκηση ζώων, μέχρι το παράλογο, όπως ένα πλωτό διώροφο λεωφορείο.

«Αν πάτε στο Bing και αναζητήσετε ένα πουλί, θα έχετε μια εικόνα πουλιού. Αλλά εδώ, οι εικόνες δημιουργούνται από τον υπολογιστή, pixel προς pixel, από την αρχή», δήλωσε ο Xiaodong He, κύριος ερευνητής και διευθυντής έρευνας στο Deep Learning Technology Center στο ερευνητικό εργαστήριο της Microsoft στο Redmond της Ουάσιγκτον. "Αυτά τα πουλιά μπορεί να μην υπάρχουν στον πραγματικό κόσμο - είναι απλώς μια πτυχή της φαντασίας των πουλιών του υπολογιστή μας."

Η ομάδα ξεκίνησε με το CaptionBot, το οποίο έγραφε αυτόματα λεζάντες για εικόνες (χρησιμοποιείται στο Facebook, για παράδειγμα, για να επισημάνει εικόνες για λόγους προσβασιμότητας), μετά το SeeingAI, το οποίο επέτρεπε στους χρήστες με προβλήματα όρασης να χρησιμοποιούν την κάμερα του τηλεφώνου τους για να τους περιγράφουν σκηνές και τώρα επιτέλους Drawing Bot.

«Τώρα θέλουμε να χρησιμοποιήσουμε το κείμενο για να δημιουργήσουμε την εικόνα», είπε ο Qiuyuan Huang, μεταδιδακτορικός ερευνητής στην ομάδα He's και συν-συγγραφέας της εργασίας. «Λοιπόν, είναι ένας κύκλος».

Το κατόρθωμα είναι ένα παράδειγμα ενός Generative Adversarial Network, ή GAN, όπου ένα δίκτυο AI, η γεννήτρια προσπαθεί να περάσει ψεύτικες φωτογραφίες πέρα ​​από ένα άλλο δίκτυο AI, το διακριτικό. Δουλεύοντας μαζί, ο διαχωριστής ωθεί τη γεννήτρια προς την τελειότητα.

Η νέα τεχνική βελτιώνει την κατάσταση της τέχνης εστιάζοντας με τη σειρά της στα διάφορα μέρη της πρότασης, π.χ. σχεδιάζοντας πρώτα ένα κίτρινο πουλί, μετά τα μαύρα φτερά και μετά το κοντό ράμφος.

«Η προσοχή είναι ανθρώπινη έννοια. χρησιμοποιούμε μαθηματικά για να κάνουμε την προσοχή υπολογιστική», εξήγησε ο He.

«Μπορούμε να ελέγξουμε αυτό που περιγράφουμε και να δούμε πώς αντιδρά η μηχανή», εξήγησε ο He. «Μπορούμε να τσεκάρουμε και να δοκιμάσουμε τι έμαθε το μηχάνημα. Το μηχάνημα έχει κάποια κοινή λογική, αλλά μπορεί να ακολουθήσει αυτό που ζητάτε και ίσως, μερικές φορές, να φαίνεται λίγο γελοίο.»

Η τεχνολογία δημιουργίας κειμένου σε εικόνα θα μπορούσε να βρει πρακτικές εφαρμογές που λειτουργούν ως ένα είδος βοηθού σκίτσων για ζωγράφους και σχεδιαστές εσωτερικών χώρων ή ως εργαλείο για τη βελτίωση της φωτογραφίας που ενεργοποιείται με φωνή. Με περισσότερη υπολογιστική ισχύ, φαντάζεται ότι η τεχνολογία θα μπορούσε να δημιουργήσει ταινίες κινουμένων σχεδίων βασισμένες σε σενάρια, αυξάνοντας τη δουλειά που κάνουν οι δημιουργοί ταινιών κινουμένων σχεδίων αφαιρώντας μέρος της χειρωνακτικής εργασίας που εμπλέκεται.

«Για να ζουν η τεχνητή νοημοσύνη και οι άνθρωποι στον ίδιο κόσμο, πρέπει να έχουν έναν τρόπο να αλληλεπιδρούν μεταξύ τους», εξήγησε ο He. «Και η γλώσσα και το όραμα είναι οι δύο πιο σημαντικοί τρόποι αλληλεπίδρασης μεταξύ ανθρώπων και μηχανών».

Το πλήρες έγγραφο που περιγράφει την έρευνα βρίσκεται στο arXiv.org.

μέσω Microsoft.com

Περισσότερα για τα θέματα: ai, bot σχεδίασης, microsoft, Έρευνα

Αφήστε μια απάντηση

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται *