Google VLOGGER AI عکسها را با آواتارهای سخنگو واقعی زنده میکند
2 دقیقه خواندن
منتشر شده در
صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب
یادداشت های کلیدی
- هوش مصنوعی گوگل آواتارهای متحرک واقعی را از تک عکس ها ایجاد می کند.
- VLOGGER از مدل های انتشار برای متحرک سازی واقعی عکس ها استفاده می کند.
- برنامه های کاربردی بالقوه شامل آواتارهای VR و دوبله ویدیو هستند.
محققان گوگل یک سیستم هوش مصنوعی جدید به نام VLOGGER ایجاد کرده اند که می تواند ویدیوهای واقعی از صحبت کردن، ژست گرفتن و حرکت افراد ایجاد کند. فقط از یک عکس ثابت
این فناوری که در یک مقاله تحقیقاتی با عنوان "VLOGGER: انتشار چندوجهی برای ترکیب آواتارهای تجسم یافته" توضیح داده شده است، از مدلهای انتشار استفاده میکند، نوعی یادگیری ماشینی که در ایجاد تصاویر از توضیحات متن برتری دارد. VLOGGER با استفاده از این فناوری در ویدیو و آموزش آن بر روی یک مجموعه داده عظیم، میتواند عکسها را به گونهای متحرک کند که بسیار متقاعدکننده باشد.
برخلاف کارهای قبلی، روش ما نیازی به آموزش برای هر فرد ندارد، به تشخیص چهره و برش تکیه نمی کند، تصویر کامل (نه فقط صورت یا لب ها) را ایجاد می کند و طیف وسیعی از سناریوها را در نظر می گیرد (به عنوان مثال بالاتنه قابل مشاهده). یا هویتهای موضوعی متنوع) که برای ترکیب صحیح انسانهایی که ارتباط برقرار میکنند، حیاتی هستند.
نویسندگان نوشتند.
قابلیت های VLOGGER شامل دوبله خودکار فیلم ها به زبان های مختلف، ویرایش فیلم ها و حتی ایجاد ویدیوهای کامل از یک تصویر است.
محققان ادعا می کنند که VLOGGER از سایر روش ها در کیفیت و واقع گرایی تصویر بهتر عمل می کند. با پیشرفت این فناوری، مرز بین ویدیوهای واقعی و مصنوعی ممکن است محو شود. VLOGGER نگاهی اجمالی به آینده هوش مصنوعی ارائه می دهد.
با این حال، نگرانی هایی در مورد سوء استفاده احتمالی وجود دارد. همانطور که VLOGGER تواناییهای خود را بهبود میبخشد، سهولت ایجاد دیپفیک نیز افزایش مییابد - ویدیوهایی که شبیه یک شخص را با دیگری جایگزین میکنند، مانند آنچه با تیلور سویفت اتفاق افتاد.
می توانید نمونه ها را مشاهده کنید اینجا کلیک نمایید.