Microsoft Research dela z umetno inteligenco, ki lahko pripoveduje zgodbo vaših počitniških posnetkov

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

izlet na plažo

Umetna inteligenca, ki lahko opisuje slike, že deluje na internetu, na primer dodaja napise slikam na Facebooku. Zdaj Microsoft Research dviguje tehnologijo na višjo raven in od njihove umetne inteligence zahteva, da pove zgodbo serije slik.

Na primer, medtem ko lahko program za podnapisovanje slik posname pet slik in reče: »To je slika družine; to je slika torte; to je slika psa; to je slika plaže,« lahko program za pripovedovanje zgodb vzame te iste slike in reče: »Družina se je zbrala na kuhanju; imeli so veliko okusne hrane; pes je bil vesel, da je tam; na plaži so se imeli lepo; celo plavali so v vodi.«

V prihodnosti bi lahko računalniško pripovedovanje zgodb ljudem pomagalo samodejno ustvariti zgodbe za diaprojekcije slik, ki jih naložijo v družbene medije, je dejal Mitchell. »Ljudem bi pomagali deliti svoje izkušnje, hkrati pa zmanjšali drobno delo, ki se nekaterim zdi precej dolgočasno,« je dejala. Računalniško pripovedovanje zgodb "lahko pomaga tudi slabovidnim, da odprejo slike ljudem, ki jih ne vidijo."

"Cilj je pomagati umetni inteligenci dati več inteligence, podobne človeški, pomagati ji razumeti stvari na bolj abstraktni ravni - kaj pomeni biti zabaven ali srhljiv, čuden ali zanimiv," je povedala višja avtorica študije Margaret Mitchell, računalniška znanstvenica pri Microsoftove raziskave. »Ljudje si skozi eone prenašamo zgodbe in jih uporabljamo za posredovanje naše morale, strategij in modrosti. Z našo osredotočenostjo na pripovedovanje zgodb upamo, da bomo pomagali umetni inteligenci razumeti človeške koncepte na način, ki je zelo varen in koristen za človeštvo, namesto da bi ga učili, kako premagati človeštvo.«

Če se umetna inteligenca kdaj nauči pripovedovati zgodbe na podlagi zaporedja slik, je "to odskočna deska k temu, da storimo enako za video," je dejal Mitchell. »To bi lahko pomagalo zagotoviti zanimive aplikacije. Na primer, za varnostne kamere bi morda želeli samo povzetek česar koli omembe vrednega, ali pa bi samodejno tvitali dogodke v živo,« je dejala.

Raziskovalci bodo svoje ugotovitve predstavili v San Diegu na letnem srečanju severnoameriškega oddelka Združenja za računalniško jezikoslovje pozneje ta mesec.

Več o temah: ai, Microsoftove raziskave