با Sora آشنا شوید، مدل جدید متن به ویدیو OpenAI که ویدیوهای HD خیره کننده را بر اساس پیام های متنی ایجاد می کند.

مسئله این نیست که "آیا ما می توانیم آن را انجام دهیم"، بلکه "آیا باید آن را انجام دهیم" است.

صفحه اصلی » رسانه

2 دقیقه خواندن

منتشر شده در فوریه 16، 2024

by رافلی گیلان

منتشر شده در فوریه 16، 2024

خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم.

یادداشت های کلیدی

OpenAI به تازگی یک مدل جدید هوش مصنوعی متن به ویدیو به نام Sora را معرفی کرده است که در عین حال چشمگیر و در عین حال ترسناک به نظر می رسد.
اکنون مردم نگران هستند که آیا این مدل مشاغل آنها را تصاحب خواهد کرد یا خیر.
این مدل زمانی که در آینده در یک محصول OpenAI اجرا شود، ابرداده C2PA را به همراه خواهد داشت.

OpenAI به تازگی یک مدل جدید هوش مصنوعی متن به ویدیو را معرفی کرده است. سو، و چشمگیر به نظر می رسد. فرضیه آن بسیار ساده و در عین حال قابل توجه به نظر می رسد: می توانید هر درخواست کلمه ای را تایپ کنید، با هر جزئیاتی که می خواهید، و سپس مدل هوش مصنوعی با یک ویدیوی 60 ثانیه ای با جزئیات بالا باز خواهد گشت.

به برخی از نتایجی که سورا می تواند انجام دهد نگاهی بیندازید:

اعلان: «چند ماموت غول پیکر پشمالو نزدیک می شوند و از میان یک چمنزار برفی قدم می زنند، خز پشمی بلندشان هنگام راه رفتن به آرامی در باد می وزد، درختان پوشیده از برف و کوه های پوشیده از برف چشمگیر در دوردست، نور نیمه بعدازظهر با ابرهای تند و خورشید در بالا. فاصله… pic.twitter.com/Um5CWI18nS
- OpenAI (OpenAI @) فوریه 15، 2024

اعلان: «تریلر فیلمی شامل ماجراهای مرد فضایی 30 ساله با کلاه ایمنی موتورسیکلت بافتنی پشمی قرمز، آسمان آبی، صحرای نمک، سبک سینمایی، فیلم‌برداری شده با فیلم 35 میلی‌متری، رنگ‌های زنده». pic.twitter.com/0JzpwPUGPB
- OpenAI (OpenAI @) فوریه 15، 2024

اعلان: «دنیای صنایع دستی کاغذی بسیار زیبا از صخره‌های مرجانی، مملو از ماهی‌های رنگارنگ و موجودات دریایی». pic.twitter.com/gzEE8SwP81
- OpenAI (OpenAI @) فوریه 15، 2024

اعلان: «صحنه متحرک نمای نزدیک از یک هیولای کرکی کوتاه است که در کنار یک شمع قرمز در حال ذوب زانو زده است. سبک هنری سه بعدی و واقع گرایانه است، با تمرکز بر نور و بافت. حال و هوای نقاشی حالت شگفتی و کنجکاوی دارد، زیرا هیولا با چشم به شعله می نگرد… pic.twitter.com/aLMgJPI0y6
- OpenAI (OpenAI @) فوریه 15، 2024

این واقعاً ترسناک و در عین حال تأثیرگذار است. واکنش عمومی به آن ترکیبی از هیبت و هشدار است، به ویژه با در نظر گرفتن قوانین گذشته OpenAI اختلاف با شرکت های روزنامه نگاری به دلیل استفاده از مقالات آنها برای آموزش مدل بدون رضایت آنها.

و همچنین باید در مورد مشاغل بالقوه ای که می توانند جایگزین شوند صحبت کنیم. حتی خود سام آلتمن، رئیس OpenAI، که یک بار از این سمت برکنار شد، گفت که سرعت تحقیقات هوش مصنوعی ما بوده است خیلی سریع پیش میره و میزان سازگاری که نوع بشر باید انجام دهد، نگران کننده است.

این مدل بر اساس تحقیقات گذشته DALL-E و GPT، با استفاده از روش بازنویسی منحصر به فرد DALL-E 3 برای ایجاد زیرنویس‌های بسیار توصیفی برای داده‌های آموزشی بصری ساخته شده است. با این حال، هنوز با چالش هایی مواجه است در شبیه‌سازی واقعی صحنه‌های پیچیده، درک روابط علت و معلولی و عدم گیج‌کننده جزئیات فضایی یک اعلان.

هنگامی که در آینده در یک محصول OpenAI، چه ChatGPT، یک پیشنهاد جدید یا Copilot پیاده سازی شود، این مدل دارای ابرداده های C2PA خواهد بود، مشابه آنچه مایکروسافت روی آن انجام داده است. Image Creator از Designer. بررسی های متن و تصویر از محصولات OpenAI در برابر محتوای مضر مانند خشونت، سخنان مشوق نفرت و نقض IP محافظت می کند.

OpenAI می‌گوید: «ما همچنین به تعدادی از هنرمندان تجسمی، طراحان و فیلم‌سازان اجازه دسترسی می‌دهیم تا بازخوردی در مورد چگونگی پیشبرد این مدل به دست آورند تا برای حرفه‌ای‌های خلاق بسیار مفید باشد.

رافلی گیلان

گزارشگر فنی

رافلی خبرنگاری با سال ها تجربه روزنامه نگاری از فناوری، تجارت، اجتماعی و فرهنگی است. در حال حاضر اخبار مربوط به محصولات، فناوری و هوش مصنوعی مایکروسافت را در گزارش Windows و MSPowerUser گزارش می‌کند. نکته ای دارید؟ این را بفرست به [ایمیل محافظت شده].