تولید 1 دقیقه ویدیوی سورا OpenAI ممکن است بیش از یک ساعت طول بکشد

نماد زمان خواندن 2 دقیقه خواندن


خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم. نماد راهنمای ابزار

صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب

یادداشت های کلیدی

  • سورای OpenAI از اعلان های متنی ویدیوها را تولید می کند. اما زمان رندر طولانی است.
  • بحث‌ها نشان می‌دهد که تولید یک دقیقه ویدیو ممکن است بیش از یک ساعت طول بکشد.
  • کاربران نگرانی‌های خود را در مورد مقیاس‌پذیری و کاربردی بودن گردش‌های کاری تکراری ابراز کردند.

مدل هوش مصنوعی OpenAI که اخیراً رونمایی شده است، Sora، ویدیوهایی با ظاهر واقعی از پیام های متنی تولید می کند. با این حال، بحث ها نشان می دهد که تولید یک دقیقه ویدیو با استفاده از Sora می تواند بیش از یک ساعت طول بکشد.

در حالی که چارچوب زمانی دقیق همچنان نامشخص است، این پست در Reddit زمان های رندر قابل توجهی را در مقایسه با روش های سنتی ایجاد ویدیو نشان می دهد. توجه به این نکته ضروری است که بحث ها بر اساس اطلاعات محدود است، محققان در درجه اول نمونه های از پیش انتخاب شده را به نمایش می گذارند و اجازه دسترسی عمومی به درخواست های سفارشی را نمی دهند. طولانی ترین ویدئوی نمایش داده شده تنها 17 ثانیه طول کشید.

دیدگاه های متعددی در رابطه با این زمان های رندر ظاهر شده است. برخی از کاربران در مورد غیرعملی بودن زمان‌های رندر طولانی، به‌ویژه هنگام تکرار از طریق چند اعلان، نظر دادند:

اگر می خواهید چندین فرمان را امتحان کنید، این یک مشکل بزرگ خواهد بود.

دیگران در مورد دلایل بالقوه پشت زمان‌های رندر طولانی حدس‌زنی کردند، با یکی از کاربران که به نظرات مدیر عامل OpenAI، سم آلتمن، در مورد نیازهای مالی قابل توجه اشاره کرد:

من می توانم ببینم چرا او (سام آلتمن) اکنون 7 تریلیون می خواهد.

همچنین مقایسه‌ها با مدل دیگری که اخیراً اعلام شده است، انجام شد. جمینی 1.5 گوگل، برجسته کردن چشم انداز رقابتی:

در نهایت، برخی از کاربران تلاش کردند تا زمان‌های رندر را با مقایسه آن‌ها با انیمیشن‌های سنتی زمینه‌ای کنند:

این کاملا منطقی است. 90 ساعت برای یک فیلم 90 دقیقه ای. وقتی شما پس انداز تمام کار معمولی انیمیشن را محاسبه می کنید، این اصلاً دیوانه کننده نیست. اما با فرض صفر شات، دقت 100%، توهمات صفر و 100% انتقال شخصیت در بیشتر فیلم،

یکی از بزرگترین چیزهای قابل توجه این است که زمان تعجب آور نیست، اما غیبت 1 دقیقه به من می گوید که بعد از 20 ثانیه، ممکن است شروع به توهم زیاد، که در حال حاضر برای LLM شناخته شده است.

به طور کلی، اطلاعات مربوط به زمان‌های رندر سورا بر مرحله توسعه مداوم این فناوری تاکید می‌کند. در حالی که پتانسیل ایجاد ویدیوی تولید شده توسط هوش مصنوعی مشهود است، پرداختن به کارایی و مقیاس‌پذیری برای پذیرش گسترده‌تر حیاتی است.

همانطور که Sora به تکامل خود ادامه می دهد، جالب است که ببینیم چگونه با این چالش ها مقابله می شود و چگونه فناوری آینده ایجاد ویدیو را شکل می دهد.

بیشتر در مورد موضوعات: openAI, سو