Το Google VLOGGER AI ζωντανεύει τις φωτογραφίες με ζωντανά άβαταρ που μιλάνε

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Βασικές σημειώσεις

  • Το Google AI δημιουργεί ζωντανά άβαταρ που μιλάνε από μεμονωμένες φωτογραφίες.
  • Το VLOGGER χρησιμοποιεί μοντέλα διάχυσης για ρεαλιστική κίνηση των φωτογραφιών.
  • Οι πιθανές εφαρμογές περιλαμβάνουν είδωλα εικονικής πραγματικότητας και μεταγλώττιση βίντεο.

Οι ερευνητές της Google ανέπτυξαν ένα νέο σύστημα τεχνητής νοημοσύνης που ονομάζεται VLOGGER που μπορεί να δημιουργήσει ρεαλιστικά βίντεο ανθρώπων που μιλούν, χειρονομούν και κινούνται από μια μόνο φωτογραφία.

Αυτή η τεχνολογία, που περιγράφεται σε μια ερευνητική εργασία με τίτλο «VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis», αξιοποιεί μοντέλα διάχυσης, έναν τύπο μηχανικής μάθησης που υπερέχει στη δημιουργία εικόνων από περιγραφές κειμένου. Εφαρμόζοντας αυτήν την τεχνολογία σε βίντεο και εκπαιδεύοντάς το σε ένα τεράστιο σύνολο δεδομένων, το VLOGGER μπορεί να κάνει κινούμενες φωτογραφίες με τρόπο που είναι πολύ πειστικό.

Σε αντίθεση με προηγούμενες εργασίες, η μέθοδός μας δεν απαιτεί εκπαίδευση για κάθε άτομο, δεν βασίζεται σε ανίχνευση προσώπου και περικοπή, δημιουργεί την πλήρη εικόνα (όχι μόνο το πρόσωπο ή τα χείλη) και εξετάζει ένα ευρύ φάσμα σεναρίων (π.χ. ορατός κορμός ή διαφορετικές ταυτότητες υποκειμένων) που είναι κρίσιμες για τη σωστή σύνθεση των ανθρώπων που επικοινωνούν.

Έγραψαν οι συγγραφείς.

Οι δυνατότητες του VLOGGER περιλαμβάνουν αυτόματη μεταγλώττιση βίντεο σε διαφορετικές γλώσσες, επεξεργασία βίντεο, ακόμη και δημιουργία πλήρων βίντεο από μία μόνο εικόνα.

Οι ερευνητές ισχυρίζονται ότι το VLOGGER ξεπερνά άλλες μεθόδους σε ποιότητα εικόνας και ρεαλισμό. Καθώς αυτή η τεχνολογία προχωρά, η γραμμή μεταξύ πραγματικών και τεχνητών βίντεο μπορεί να θολώσει. Το VLOGGER προσφέρει μια ματιά στο μέλλον της τεχνητής νοημοσύνης.

Ωστόσο, υπάρχουν ανησυχίες σχετικά με πιθανή κακή χρήση. Καθώς το VLOGGER βελτιώνει τις ικανότητές του, το ίδιο κάνει και η ευκολία δημιουργίας deepfakes – βίντεο που αντικαθιστούν την ομοιότητα ενός ατόμου με ένα άλλο, όπως αυτό συνέβη με την Taylor Swift.

Μπορείτε να δείτε τα παραδείγματα εδώ.

Αφήστε μια απάντηση

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται *