Microsoft Research navdihuje bot za podnapise videoposnetkov

Ikona časa branja 2 min. prebrati

Ikona koledarja Objavljeno dne Oktober 11, 2016

Objavljeno dne Oktober 11, 2016

Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo.

Dva kitajska raziskovalca, Chia-Wen Lin in Min Sun, profesorja na oddelku za elektrotehniko nacionalne univerze Tsinghua na Tajvanu, sta ustvarila bota, ki bo namesto vas gledal vaš videoposnetek, določil njegove poudarke, ustvaril ustrezen naslov za enostavno iskanje in priporočam, kdo bi morda želel biti označen za ogled.

Profesor Lin in profesor Sun sta po navdihu COCO (Common Objects in Context) podjetja Microsoft Research sodelovala z dr. Tao Mei, vodilnim raziskovalcem multimedije pri Microsoft Research Asia leta 2015, z uporabo napisov COCO za povečevanje stavkov in uporabo napisov v MSCOCO za usposabljanje svojih sistem.

Njihov lastni sistem je analiziral 18,000 videoposnetkov za vrhunce in ustvaril 44,000 naslovov/opisov. Za izboljšanje sistema so profesor Sun in njegovi študenti sodelovali v izzivu VideoToText, ki ga sponzorira Microsoft Research, pri čemer so podatke, objavljene v izzivu, uporabili za dodatno potrditev.

"Naša raziskava nas je pripeljala korak bližje svetemu gralu vizualne inteligence, razumevanju vizualne vsebine v videoposnetkih, ki jih ustvarijo uporabniki," je dejal profesor Sun.

Njihove raziskave vam bodo sčasoma omogočile, da preprosto najdete in gledate vsebino, ki jo ustvarijo uporabniki na družbenih omrežjih, vključno s tistim neverjetnim posnetkom vašega dedka, ki izgublja zobe med plesom na poroki vašega bratranca.

Raziskave profesorja Suna in dr. Tao Meija so bili objavljeni na Arxiv.org tukaj.

Več o temah: računalniški vid, Microsoftove raziskave

Surur Davids

Strokovnjak za pametne telefone

Surur Davids je ustanovitelj WMPoweruser, ki je kasneje postal MSPoweruser.com. Je strokovnjak za pametne telefone z več kot desetletnimi izkušnjami.

Pustite Odgovori