تحقیقات مایکروسافت روی یک هوش مصنوعی کار می کند که می تواند داستان عکس های تعطیلات شما را بازگو کند

نماد زمان خواندن 2 دقیقه خواندن


خوانندگان به پشتیبانی از MSpoweruser کمک می کنند. در صورت خرید از طریق پیوندهای ما ممکن است کمیسیون دریافت کنیم. نماد راهنمای ابزار

صفحه افشای ما را بخوانید تا بدانید چگونه می توانید به MSPoweruser کمک کنید تا تیم تحریریه را حفظ کند ادامه مطلب

سفر به ساحل

هوش مصنوعی که می‌تواند تصاویر را توصیف کند، در حال حاضر در اینترنت کار می‌کند و برای مثال در فیس‌بوک به تصاویر زیرنویس اضافه می‌کند. اکنون مایکروسافت ریسرچ فن‌آوری را به سطح بالاتری می‌برد و از هوش مصنوعی خود می‌خواهد که داستان مجموعه‌ای از تصاویر را تعریف کند.

برای مثال، در حالی که یک برنامه زیرنویس تصویر ممکن است پنج تصویر بگیرد و بگوید: «این تصویر یک خانواده است. این عکس یک کیک است این عکس یک سگ است این تصویری از یک ساحل است. آنها غذاهای خوشمزه زیادی داشتند. سگ از حضور در آنجا خوشحال بود. آنها اوقات خوبی را در ساحل داشتند. آنها حتی در آب شنا کردند.»

میچل گفت، در آینده، داستان سرایی رایانه‌ای می‌تواند به مردم کمک کند تا به‌طور خودکار داستان‌هایی را برای نمایش اسلاید تصاویری که در رسانه‌های اجتماعی آپلود می‌کنند، تولید کنند. او گفت: "شما به مردم کمک می کنید تا تجربیات خود را به اشتراک بگذارند و در عین حال کارهای سختی که به نظر برخی افراد بسیار خسته کننده است را کاهش دهید." داستان سرایی رایانه‌ای «همچنین می‌تواند به افرادی که دارای اختلال بینایی هستند کمک کند تا تصاویر را برای افرادی که نمی‌توانند آن‌ها را ببینند باز کنند».

مارگارت میچل، نویسنده ارشد این مطالعه، دانشمند کامپیوتر در این باره گفت: "هدف کمک به هوش مصنوعی بیشتر شبیه انسان است، کمک به درک چیزها در سطح انتزاعی تر - به معنای سرگرم کننده یا ترسناک یا عجیب یا جالب بودن چیست." تحقیقات مایکروسافت «مردم داستان‌هایی را برای اعصار متمادی نقل کرده‌اند و از آن‌ها برای انتقال اخلاق، استراتژی‌ها و حکمت ما استفاده می‌کنند. با تمرکز بر داستان سرایی، امیدواریم به هوش مصنوعی کمک کنیم تا مفاهیم انسانی را به گونه ای درک کند که برای بشر بسیار ایمن و مفید باشد، نه اینکه به آن آموزش دهیم چگونه انسان را شکست دهد.

میچل گفت: اگر هوش مصنوعی یاد بگیرد که بر اساس توالی تصاویر داستان بگوید، "این یک پله برای انجام همین کار برای ویدئو است." این می تواند به ارائه برنامه های کاربردی جالب کمک کند. به عنوان مثال، برای دوربین‌های امنیتی، ممکن است فقط خلاصه‌ای از هر چیز قابل توجهی را بخواهید، یا می‌توانید به طور خودکار رویدادهای توییتی را به صورت زنده ارسال کنید.

محققان یافته‌های خود را در سن دیگو در نشست سالانه انجمن زبان‌شناسی محاسباتی آمریکای شمالی در اواخر این ماه ارائه خواهند کرد.

بیشتر در مورد موضوعات: ai, تحقیقات مایکروسافت