Microsoft Research працює з штучним інтелектом, який може розповісти історію ваших святкових знімків

Значок часу читання 2 хв. читати


Читачі допомагають підтримувати MSpoweruser. Ми можемо отримати комісію, якщо ви купуєте через наші посилання. Значок підказки

Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі

поїздка на пляж

ШІ, який може описувати зображення, вже працює в Інтернеті, наприклад, додає підписи до зображень у Facebook. Тепер Microsoft Research виводить технологію на новий рівень, попросивши свій AI розповісти історію серії фотографій.

Наприклад, програма підписання зображень може взяти п’ять зображень і сказати: «Це зображення сім’ї; це зображення торта; це зображення собаки; це зображення пляжу», — програма розповіді може взяти ті самі зображення і сказати: «Сім’я зібралася на кулінарію; у них було багато смачної їжі; пес був щасливий бути там; вони чудово провели час на пляжі; вони навіть купалися у воді».

У майбутньому комп’ютеризоване оповідання може допомогти людям автоматично створювати казки для слайд-шоу зображень, які вони завантажують у соціальні мережі, сказав Мітчелл. «Ви б допомогли людям поділитися своїм досвідом, зменшивши при цьому дрібну роботу, яку деякі люди вважають досить втомливою», — сказала вона. Комп’ютеризоване оповідання «також може допомогти людям з вадами зору відкрити зображення для людей, які їх не бачать».

«Мета полягає в тому, щоб допомогти штучному інтелекту надати більше людського інтелекту, допомогти йому зрозуміти речі на більш абстрактному рівні — що означає бути веселим, моторошним, дивним чи цікавим», — сказала старший автор дослідження Маргарет Мітчелл, науковець з інформатики. Microsoft Research. «Люди передавали історії протягом багатьох років, використовуючи їх, щоб передати нашу мораль, стратегії та мудрість. Зосереджуючись на розповіді, ми сподіваємося допомогти штучному інтелекту зрозуміти людські поняття таким чином, щоб це було дуже безпечно та корисно для людства, а не навчати його, як перемогти людство».

Якщо ШІ коли-небудь навчиться розповідати історії на основі послідовностей зображень, «це крок до того, щоб робити те саме для відео», — сказав Мітчелл. «Це може допомогти створити цікаві програми. Наприклад, для камер відеоспостереження вам може знадобитися лише підсумок чогось важливого, або ви можете автоматично транслювати події в твіті», – сказала вона.

Дослідники презентують свої висновки в Сан-Дієго на щорічній зустрічі північноамериканського відділення Асоціації комп’ютерної лінгвістики пізніше цього місяця.

Детальніше про теми: ai, дослідження Microsoft