Google VLOGGER AI عکس‌ها را با آواتارهای سخنگو واقعی زنده می‌کند

صفحه اصلی » رسانه

نماد زمان خواندن 2 دقیقه خواندن

نماد تقویم منتشر شده در مارس 18، 2024

by دوش بری

منتشر شده در مارس 18، 2024

خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم.

یادداشت های کلیدی

هوش مصنوعی گوگل آواتارهای متحرک واقعی را از تک عکس ها ایجاد می کند.
VLOGGER از مدل های انتشار برای متحرک سازی واقعی عکس ها استفاده می کند.
برنامه های کاربردی بالقوه شامل آواتارهای VR و دوبله ویدیو هستند.

محققان گوگل یک سیستم هوش مصنوعی جدید به نام VLOGGER ایجاد کرده اند که می تواند ویدیوهای واقعی از صحبت کردن، ژست گرفتن و حرکت افراد ایجاد کند. فقط از یک عکس ثابت

این فناوری که در یک مقاله تحقیقاتی با عنوان "VLOGGER: انتشار چندوجهی برای ترکیب آواتارهای تجسم یافته" توضیح داده شده است، از مدل‌های انتشار استفاده می‌کند، نوعی یادگیری ماشینی که در ایجاد تصاویر از توضیحات متن برتری دارد. VLOGGER با استفاده از این فناوری در ویدیو و آموزش آن بر روی یک مجموعه داده عظیم، می‌تواند عکس‌ها را به گونه‌ای متحرک کند که بسیار متقاعدکننده باشد.

برخلاف کارهای قبلی، روش ما نیازی به آموزش برای هر فرد ندارد، به تشخیص چهره و برش تکیه نمی کند، تصویر کامل (نه فقط صورت یا لب ها) را ایجاد می کند و طیف وسیعی از سناریوها را در نظر می گیرد (به عنوان مثال بالاتنه قابل مشاهده). یا هویت‌های موضوعی متنوع) که برای ترکیب صحیح انسان‌هایی که ارتباط برقرار می‌کنند، حیاتی هستند.

نویسندگان نوشتند.

قابلیت های VLOGGER شامل دوبله خودکار فیلم ها به زبان های مختلف، ویرایش فیلم ها و حتی ایجاد ویدیوهای کامل از یک تصویر است.

محققان ادعا می کنند که VLOGGER از سایر روش ها در کیفیت و واقع گرایی تصویر بهتر عمل می کند. با پیشرفت این فناوری، مرز بین ویدیوهای واقعی و مصنوعی ممکن است محو شود. VLOGGER نگاهی اجمالی به آینده هوش مصنوعی ارائه می دهد.

با این حال، نگرانی هایی در مورد سوء استفاده احتمالی وجود دارد. همانطور که VLOGGER توانایی‌های خود را بهبود می‌بخشد، سهولت ایجاد دیپ‌فیک نیز افزایش می‌یابد - ویدیوهایی که شبیه یک شخص را با دیگری جایگزین می‌کنند، مانند آنچه با تیلور سویفت اتفاق افتاد.

می توانید نمونه ها را مشاهده کنید اینجا کلیک نمایید.

دوش بری

روزنامه نگار فناوری

اینها چیزهایی هستند که به من انگیزه می دهند - ایجاد محتوای آموزنده و مفید، دنبال کردن علاقه ام به ورزش های موتوری و موسیقی، شرکت در سفرهای اعزامی، حفظ یک سبک زندگی سالم، و گذراندن وقت با گربه دوست داشتنی ام تاکو.

پاسخ دهید