Microsoft Research razvija neverjeten algoritem za obnovo fotografij

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

Microsoftova raziskovalna skupina Ziyu Wan, Bo Zhang in drugi so razvili nov algoritem, ki temelji na umetni inteligenci, za obnavljanje starih fotografij, ki so močno poškodovane s pristopom globokega učenja.

Za razliko od običajnih obnovitvenih nalog, ki jih je mogoče rešiti z nadzorovanim učenjem, je degradacija pri resničnih fotografijah zapletena in domenska vrzel med sintetičnimi slikami in resničnimi starimi fotografijami povzroči, da se omrežje ne posploši.

Njihova nova tehnika predlaga novo omrežje prevajanja tripletne domene z uporabo resničnih fotografij skupaj z množičnimi sintetičnimi pari slik. Natančneje, usposobijo dva variacijska samodejna kodirnika (VAE), da preoblikujejo stare fotografije in čiste fotografije v dva latentna prostora. In prevod med tema dvema latentnima prostoroma se nauči s sintetičnimi seznanjenimi podatki.

Šest različnih slik prikazuje izvirno fotografijo in veliko izboljšano različico po pregledu modela. Slika ena: zbledela slika, če dekle drži rože. Slika druga: Posnetek obledele ženske, ki se smehlja in drži ptico na roki pred obrazom. Tretja slika: zbledela in razbarvana podoba mlade osebe z dolgimi lasmi in očali s prisiljenim nasmehom. Slika četrta: Zbledela in razbarvana podoba ženske v obleki s psom v naročju. Slika peta: razpokana in upognjena črno-bela podoba dečka, oblečenega v telovnik in srajco. Šesta slika: močno razpokana črno-bela slika para. Moški nosi staro vojaško uniformo, ženska pa vintage obleko. Vse slike imajo podobno visoko kakovost, pri čemer so pomanjkljivosti odstranjene po pregledu modela.

Ta prevod je dobro posplošen na resnične fotografije, ker je domenska vrzel zaprta v kompaktnem latentnem prostoru. Da bi obravnavali več degradacij, pomešanih v eni stari fotografiji, so zasnovali globalno vejo z delnim nelokalnim blokom, ki cilja na strukturirane napake, kot so praske in madeži prahu, ter lokalno vejo, ki cilja na nestrukturirane napake, kot so šumi in zamegljenost. Obe veji sta združeni v latentnem prostoru, kar vodi do izboljšane zmožnosti obnavljanja starih fotografij iz več okvar. Predlagana metoda je boljša od najsodobnejših metod glede vizualne kakovosti za obnovo starih fotografij.

Oglejte si tehniko, prikazano v spodnjem videu:

Na žalost Microsoft ni dal na voljo demo spletnega mesta za preizkus tehnologije, vendar upajmo, da bo podjetje sprejelo namig.

Preberite veliko več podrobnosti tukaj pri Microsoftu.

Več o temah: Microsoftove raziskave, foto restavracija