با Sora آشنا شوید، مدل جدید متن به ویدیو OpenAI که ویدیوهای HD خیره کننده را بر اساس پیام های متنی ایجاد می کند.

مسئله این نیست که "آیا ما می توانیم آن را انجام دهیم"، بلکه "آیا باید آن را انجام دهیم" است.

نماد زمان خواندن 2 دقیقه خواندن


خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم. نماد راهنمای ابزار

صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب

یادداشت های کلیدی

  • OpenAI به تازگی یک مدل جدید هوش مصنوعی متن به ویدیو به نام Sora را معرفی کرده است که در عین حال چشمگیر و در عین حال ترسناک به نظر می رسد.
  • اکنون مردم نگران هستند که آیا این مدل مشاغل آنها را تصاحب خواهد کرد یا خیر.
  • این مدل زمانی که در آینده در یک محصول OpenAI اجرا شود، ابرداده C2PA را به همراه خواهد داشت.

OpenAI به تازگی یک مدل جدید هوش مصنوعی متن به ویدیو را معرفی کرده است. سو، و چشمگیر به نظر می رسد. فرضیه آن بسیار ساده و در عین حال قابل توجه به نظر می رسد: می توانید هر درخواست کلمه ای را تایپ کنید، با هر جزئیاتی که می خواهید، و سپس مدل هوش مصنوعی با یک ویدیوی 60 ثانیه ای با جزئیات بالا باز خواهد گشت. 

به برخی از نتایجی که سورا می تواند انجام دهد نگاهی بیندازید:

این واقعاً ترسناک و در عین حال تأثیرگذار است. واکنش عمومی به آن ترکیبی از هیبت و هشدار است، به ویژه با در نظر گرفتن قوانین گذشته OpenAI اختلاف با شرکت های روزنامه نگاری به دلیل استفاده از مقالات آنها برای آموزش مدل بدون رضایت آنها.

و همچنین باید در مورد مشاغل بالقوه ای که می توانند جایگزین شوند صحبت کنیم. حتی خود سام آلتمن، رئیس OpenAI، که یک بار از این سمت برکنار شد، گفت که سرعت تحقیقات هوش مصنوعی ما بوده است خیلی سریع پیش میره و میزان سازگاری که نوع بشر باید انجام دهد، نگران کننده است.

این مدل بر اساس تحقیقات گذشته DALL-E و GPT، با استفاده از روش بازنویسی منحصر به فرد DALL-E 3 برای ایجاد زیرنویس‌های بسیار توصیفی برای داده‌های آموزشی بصری ساخته شده است. با این حال، هنوز با چالش هایی مواجه است در شبیه‌سازی واقعی صحنه‌های پیچیده، درک روابط علت و معلولی و عدم گیج‌کننده جزئیات فضایی یک اعلان.

هنگامی که در آینده در یک محصول OpenAI، چه ChatGPT، یک پیشنهاد جدید یا Copilot پیاده سازی شود، این مدل دارای ابرداده های C2PA خواهد بود، مشابه آنچه مایکروسافت روی آن انجام داده است. Image Creator از Designer. بررسی های متن و تصویر از محصولات OpenAI در برابر محتوای مضر مانند خشونت، سخنان مشوق نفرت و نقض IP محافظت می کند.

OpenAI می‌گوید: «ما همچنین به تعدادی از هنرمندان تجسمی، طراحان و فیلم‌سازان اجازه دسترسی می‌دهیم تا بازخوردی در مورد چگونگی پیشبرد این مدل به دست آورند تا برای حرفه‌ای‌های خلاق بسیار مفید باشد.