1 λεπτό του βίντεο Sora του OpenAI μπορεί να χρειαστεί πάνω από μία ώρα για να δημιουργηθεί

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Βασικές σημειώσεις

  • Το Sora του OpenAI δημιουργεί βίντεο από μηνύματα κειμένου, αλλά οι χρόνοι απόδοσης είναι μεγάλοι.
  • Οι συζητήσεις δείχνουν ότι μπορεί να χρειαστεί πάνω από μία ώρα για να δημιουργηθεί ένα λεπτό βίντεο.
  • Οι χρήστες εξέφρασαν ανησυχίες σχετικά με την επεκτασιμότητα και την πρακτικότητα των επαναληπτικών ροών εργασίας.

Το μοντέλο τεχνητής νοημοσύνης που αποκαλύφθηκε πρόσφατα του OpenAI, Sora, δημιουργεί βίντεο με ρεαλιστική εμφάνιση από μηνύματα κειμένου. Ωστόσο, οι συζητήσεις υποδηλώνουν ότι η δημιουργία ενός μόνο λεπτού βίντεο χρησιμοποιώντας το Sora μπορεί να διαρκέσει πάνω από μία ώρα.

Ενώ το ακριβές χρονικό πλαίσιο παραμένει ασαφές, αυτή η ανάρτηση στο Reddit υποδεικνύει σημαντικούς χρόνους απόδοσης σε σύγκριση με τις παραδοσιακές μεθόδους δημιουργίας βίντεο. Είναι σημαντικό να σημειωθεί ότι αυτά οι συζητήσεις βασίζονται σε περιορισμένες πληροφορίες, με τους ερευνητές να παρουσιάζουν κυρίως προεπιλεγμένα παραδείγματα και να μην επιτρέπουν την πρόσβαση του κοινού σε προσαρμοσμένα μηνύματα προτροπής. Το μεγαλύτερο σε διάρκεια βίντεο που παρουσιάστηκε ήταν μόνο 17 δευτερολέπτων.

Έχουν προκύψει αρκετές προοπτικές σχετικά με αυτούς τους χρόνους απόδοσης. Ορισμένοι χρήστες σχολίασαν το μη πρακτικό των μεγάλων χρόνων απόδοσης, ιδιαίτερα κατά την επανάληψη μέσω πολλαπλών μηνυμάτων:

Εάν πρόκειται να χρειαστεί να δοκιμάσετε πολλές προτροπές, αυτό θα είναι μεγάλο πρόβλημα.

Άλλοι εικάζουν τους πιθανούς λόγους πίσω από τους μεγάλους χρόνους απόδοσης, με έναν χρήστη να αναφέρεται σε σχόλια από τον Διευθύνοντα Σύμβουλο του OpenAI, Sam Altman, σχετικά με σημαντικές ανάγκες χρηματοδότησης:

Μπορώ να δω γιατί αυτός (Ο Σαμ Άλτμαν) θέλει 7 τρισ.

Έγιναν επίσης συγκρίσεις με ένα άλλο μοντέλο τεχνητής νοημοσύνης που ανακοινώθηκε πρόσφατα, Το Gemini 1.5 της Google, τονίζοντας το ανταγωνιστικό τοπίο:

Σχόλιο
byu/hasanahmad από τη συζήτηση
inOpenAI

Τέλος, ορισμένοι χρήστες προσπάθησαν να προσαρμόσουν τους χρόνους απόδοσης συγκρίνοντάς τους με τα παραδοσιακά κινούμενα σχέδια:

Αυτό είναι αρκετά λογικό. 90 ώρες για μια ταινία 90 λεπτών. Όταν υπολογίζετε τις οικονομίες για όλη την τυπική εργασία κινουμένων σχεδίων, αυτό δεν είναι καθόλου τρελό. Αλλά υποθέτοντας μηδέν πλάνα, 100% ακρίβεια, μηδενικές παραισθήσεις και 100% μεταφορά χαρακτήρων στο μεγαλύτερο μέρος της ταινίας,

Ένα από τα μεγαλύτερα αξιοσημείωτα πράγματα είναι ότι ο χρόνος δεν προκαλεί έκπληξη, αλλά η απουσία 1 λεπτού μου λέει ότι μετά από 20 δευτερόλεπτα, μπορεί να αρχίσει να έχουν πολλές παραισθήσεις, κάτι που είναι επί του παρόντος γνωστό για τα LLM.

Συνολικά, οι πληροφορίες σχετικά με τους χρόνους απόδοσης του Sora υπογραμμίζουν το συνεχιζόμενο στάδιο ανάπτυξης της τεχνολογίας. Ενώ η δυνατότητα δημιουργίας βίντεο που δημιουργείται από την τεχνητή νοημοσύνη είναι εμφανής, η αντιμετώπιση της αποτελεσματικότητας και της επεκτασιμότητας παραμένει ζωτικής σημασίας για την ευρύτερη υιοθέτηση.

Καθώς η Sora συνεχίζει να εξελίσσεται, θα είναι ενδιαφέρον να δούμε πώς αντιμετωπίζονται αυτές οι προκλήσεις και πώς η τεχνολογία διαμορφώνει το μέλλον της δημιουργίας βίντεο.

Περισσότερα για τα θέματα: openAI, Sora