Robot na tvorbu titulkov videa inšpiruje výskum spoločnosti Microsoft

Ikona času čítania 2 min. čítať

Ikona kalendára Publikované dňa Októbra 11, 2016

publikované dňa Októbra 11, 2016

Čítačky pomáhajú podporovať MSpoweruser. Ak nakupujete prostredníctvom našich odkazov, môžeme získať províziu.

Dvaja čínski výskumníci, Chia-Wen Lin a Min Sun, profesori na oddelení elektrotechniky na Národnej univerzite Tsinghua na Taiwane, vytvorili robota, ktorý za vás pozrie vaše video, určí jeho najdôležitejšie body, vytvorí relevantný názov pre jednoduché vyhľadávanie a odporúčame, aby si to pozreli tí, ktorí by chceli byť označení.

Profesor Lin a profesor Sun, inšpirovaní COCO (Common Objects in Context) od Microsoft Research, spolupracovali s Dr. Tao Mei, vedúcim výskumníkom v oblasti multimédií v Microsoft Research Asia v roku 2015, pomocou COCO titulkov na zväčšovanie viet a pomocou titulkov v MSCOCO na trénovanie svojich systém.

Ich vlastný systém analyzoval 18,000 44,000 videí a vygeneroval XNUMX XNUMX názvov/popisov. Na zlepšenie systému sa profesor Sun a jeho študenti zúčastnili výzvy VideoToText sponzorovanej spoločnosťou Microsoft Research, pričom použili údaje zverejnené vo výzve na dodatočné overenie.

„Náš výskum nás posunul o krok bližšie k svätému grálu vizuálnej inteligencie, keď sme pochopili vizuálny obsah vo videách vytvorených používateľmi,“ povedal profesor Sun.

Ich výskum vám nakoniec umožní ľahko nájsť a sledovať obsah vytvorený používateľmi na sociálnych médiách vrátane toho úžasného klipu, v ktorom váš starý otec prišiel o zuby pri tanci na svadbe vášho bratranca.

Výskum profesora Suna a doktora Tao Mei boli zverejnené na Arxiv.org tu.

Viac o témach: počítačová vízia, výskum spoločnosti Microsoft

Surur Davids

Expert na smartfóny

Surur Davids je zakladateľom WMPoweruser, ktorý sa neskôr stal MSPoweruser.com. Je to odborník na smartfóny s viac ako desaťročnými skúsenosťami.

Nechaj odpoveď