تولید 1 دقیقه ویدیوی سورا OpenAI ممکن است بیش از یک ساعت طول بکشد
2 دقیقه خواندن
منتشر شده در
صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب
یادداشت های کلیدی
- سورای OpenAI از اعلان های متنی ویدیوها را تولید می کند. اما زمان رندر طولانی است.
- بحثها نشان میدهد که تولید یک دقیقه ویدیو ممکن است بیش از یک ساعت طول بکشد.
- کاربران نگرانیهای خود را در مورد مقیاسپذیری و کاربردی بودن گردشهای کاری تکراری ابراز کردند.
مدل هوش مصنوعی OpenAI که اخیراً رونمایی شده است، Sora، ویدیوهایی با ظاهر واقعی از پیام های متنی تولید می کند. با این حال، بحث ها نشان می دهد که تولید یک دقیقه ویدیو با استفاده از Sora می تواند بیش از یک ساعت طول بکشد.
در حالی که چارچوب زمانی دقیق همچنان نامشخص است، این پست در Reddit زمان های رندر قابل توجهی را در مقایسه با روش های سنتی ایجاد ویدیو نشان می دهد. توجه به این نکته ضروری است که بحث ها بر اساس اطلاعات محدود است، محققان در درجه اول نمونه های از پیش انتخاب شده را به نمایش می گذارند و اجازه دسترسی عمومی به درخواست های سفارشی را نمی دهند. طولانی ترین ویدئوی نمایش داده شده تنها 17 ثانیه طول کشید.
دیدگاه های متعددی در رابطه با این زمان های رندر ظاهر شده است. برخی از کاربران در مورد غیرعملی بودن زمانهای رندر طولانی، بهویژه هنگام تکرار از طریق چند اعلان، نظر دادند:
اگر می خواهید چندین فرمان را امتحان کنید، این یک مشکل بزرگ خواهد بود.
دیگران در مورد دلایل بالقوه پشت زمانهای رندر طولانی حدسزنی کردند، با یکی از کاربران که به نظرات مدیر عامل OpenAI، سم آلتمن، در مورد نیازهای مالی قابل توجه اشاره کرد:
من می توانم ببینم چرا او (سام آلتمن) اکنون 7 تریلیون می خواهد.
همچنین مقایسهها با مدل دیگری که اخیراً اعلام شده است، انجام شد. جمینی 1.5 گوگل، برجسته کردن چشم انداز رقابتی:
در نهایت، برخی از کاربران تلاش کردند تا زمانهای رندر را با مقایسه آنها با انیمیشنهای سنتی زمینهای کنند:
این کاملا منطقی است. 90 ساعت برای یک فیلم 90 دقیقه ای. وقتی شما پس انداز تمام کار معمولی انیمیشن را محاسبه می کنید، این اصلاً دیوانه کننده نیست. اما با فرض صفر شات، دقت 100%، توهمات صفر و 100% انتقال شخصیت در بیشتر فیلم،
یکی از بزرگترین چیزهای قابل توجه این است که زمان تعجب آور نیست، اما غیبت 1 دقیقه به من می گوید که بعد از 20 ثانیه، ممکن است شروع به توهم زیاد، که در حال حاضر برای LLM شناخته شده است.
به طور کلی، اطلاعات مربوط به زمانهای رندر سورا بر مرحله توسعه مداوم این فناوری تاکید میکند. در حالی که پتانسیل ایجاد ویدیوی تولید شده توسط هوش مصنوعی مشهود است، پرداختن به کارایی و مقیاسپذیری برای پذیرش گستردهتر حیاتی است.
همانطور که Sora به تکامل خود ادامه می دهد، جالب است که ببینیم چگونه با این چالش ها مقابله می شود و چگونه فناوری آینده ایجاد ویدیو را شکل می دهد.