Microsoft Research pracuje s AI, která dokáže vyprávět příběh vašich prázdninových snímků

Ikona času čtení 2 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více

výlet na pláž

Umělá inteligence, která dokáže popsat obrázky, již funguje na internetu, přidává k obrázkům například popisky na Facebooku. Nyní Microsoft Research posouvá technologii na další úroveň a žádá jejich AI, aby vyprávěla příběh série obrázků.

Například, zatímco program pro popisování obrázků může vzít pět obrázků a říci: „Toto je obrázek rodiny; toto je obrázek dortu; toto je obrázek psa; toto je obrázek pláže,“ program vyprávění by mohl vzít tytéž obrázky a říci: „Rodina se sešla na vaření; měli spoustu chutného jídla; pes byl rád, že je tam; měli se na pláži skvěle; dokonce si zaplavali ve vodě.“

V budoucnu by počítačové vyprávění příběhů mohlo lidem pomoci automaticky vytvářet příběhy pro prezentace obrázků, které nahrávají na sociální média, řekl Mitchell. „Pomohli byste lidem sdílet své zkušenosti a zároveň omezili zbytečnou práci, kterou někteří lidé považují za docela únavnou,“ řekla. Počítačové vyprávění „může také pomoci lidem se zrakovým postižením otevřít obrazy lidem, kteří je nevidí.“

„Cílem je pomoci poskytnout umělé inteligenci více lidské inteligence, pomoci jí porozumět věcem na abstraktnější úrovni – co to znamená být zábavný, strašidelný nebo divný nebo zajímavý,“ řekla hlavní autorka studie Margaret Mitchellová, počítačová vědkyně Výzkum společnosti Microsoft. „Lidé si předávali příběhy celé věky a používali je k vyjádření naší morálky, strategií a moudrosti. S naším zaměřením na vyprávění doufáme, že pomůžeme AI porozumět lidským konceptům způsobem, který je pro lidstvo velmi bezpečný a prospěšný, než abychom je učili, jak porazit lidstvo.“

Pokud se někdy umělá inteligence naučí vyprávět příběhy na základě sekvencí obrázků, „je to odrazový můstek k tomu, abychom totéž udělali pro video,“ řekl Mitchell. „To by mohlo pomoci poskytnout zajímavé aplikace. Například u bezpečnostních kamer můžete chtít jen souhrn čehokoli, co stojí za pozornost, nebo můžete automaticky živě tweetovat události,“ řekla.

Vědci představí svá zjištění v San Diegu na výročním setkání severoamerické pobočky Asociace pro počítačovou lingvistiku koncem tohoto měsíce.

Více o tématech: ai, průzkum společnosti Microsoft