1 phút video Sora của OpenAI có thể mất hơn một giờ để tạo

Biểu tượng thời gian đọc 2 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Ghi chú chính

  • Sora của OpenAI tạo video từ lời nhắc bằng văn bản, nhưng thời gian kết xuất lâu.
  • Các cuộc thảo luận cho thấy có thể mất hơn một giờ để tạo ra một phút video.
  • Người dùng bày tỏ lo ngại về khả năng mở rộng và tính thực tế của quy trình làm việc lặp đi lặp lại.

Mô hình AI mới ra mắt gần đây của OpenAI, Sora, tạo ra các video trông như thật từ lời nhắc bằng văn bản. Tuy nhiên, các cuộc thảo luận cho thấy rằng việc tạo một phút video bằng Sora có thể mất hơn một giờ.

Mặc dù khung thời gian chính xác vẫn chưa rõ ràng, bài đăng này trên Reddit cho biết thời gian kết xuất đáng kể so với các phương pháp tạo video truyền thống. Điều quan trọng cần lưu ý là những các cuộc thảo luận dựa trên thông tin hạn chế, trong đó các nhà nghiên cứu chủ yếu hiển thị các ví dụ được chọn trước và không cho phép công chúng truy cập vào lời nhắc tùy chỉnh. Video trình diễn dài nhất chỉ dài 17 giây.

Một số quan điểm đã xuất hiện liên quan đến thời gian kết xuất này. Một số người dùng nhận xét về tính không thực tế của thời gian kết xuất kéo dài, đặc biệt khi lặp qua nhiều lời nhắc:

Nếu bạn cần thử nhiều lời nhắc thì đó sẽ là một vấn đề lớn.

Những người khác suy đoán về những lý do tiềm ẩn đằng sau thời gian kết xuất lâu, trong đó một người dùng tham khảo nhận xét từ Giám đốc điều hành của OpenAI, Sam Altman, liên quan đến nhu cầu tài trợ đáng kể:

Tôi có thể hiểu tại sao anh ấy (Sam Altman) muốn có 7 nghìn tỷ ngay bây giờ.

Các so sánh cũng được rút ra từ một mô hình AI khác được công bố gần đây, Song Tử 1.5 của Google, nêu bật bối cảnh cạnh tranh:

Bình luận
byu/hoanganh từ cuộc thảo luận
inOpenAI

Cuối cùng, một số người dùng đã cố gắng bối cảnh hóa thời gian kết xuất bằng cách so sánh chúng với hoạt ảnh truyền thống:

Điều đó khá hợp lý. 90 giờ cho một bộ phim dài 90 phút. Khi bạn tính toán mức tiết kiệm cho tất cả lao động làm hoạt hình điển hình, điều đó không hề điên rồ chút nào. Nhưng giả sử không có cảnh quay nào, độ chính xác 100%, không có ảo giác và chuyển giao nhân vật 100% trong hầu hết bộ phim,

Một trong những điều đáng chú ý nhất là thời gian không có gì đáng ngạc nhiên, nhưng việc thiếu 1 phút cho tôi biết rằng sau 20 giây, nó có thể bắt đầu gây ảo giác rất nhiều, hiện được biết đến với LLM.

Nhìn chung, thông tin liên quan đến thời gian kết xuất của Sora nhấn mạnh giai đoạn phát triển không ngừng của công nghệ. Mặc dù tiềm năng tạo video do AI tạo ra là rõ ràng, nhưng việc giải quyết hiệu quả và khả năng mở rộng vẫn rất quan trọng để được áp dụng rộng rãi hơn.

Khi Sora tiếp tục phát triển, sẽ rất thú vị để xem những thách thức này được giải quyết như thế nào và công nghệ định hình tương lai của việc tạo video như thế nào.

Thông tin thêm về các chủ đề: mởAI, Sora

Bình luận

Chúng tôi sẽ không công khai email của bạn. Các ô đánh dấu * là bắt buộc *