Microsoft Research vyvinul úžasný algoritmus na obnovu fotografií

Ikona času čítania 2 min. čítať


Čítačky pomáhajú podporovať MSpoweruser. Ak nakupujete prostredníctvom našich odkazov, môžeme získať províziu. Ikona popisu

Prečítajte si našu informačnú stránku a zistite, ako môžete pomôcť MSPoweruser udržať redakčný tím Čítaj viac

Výskumný tím spoločnosti Microsoft Ziyu Wan, Bo Zhang a ďalší vyvinuli nový algoritmus založený na AI na obnovu starých fotografií, ktoré trpia vážnou degradáciou prostredníctvom prístupu hlbokého učenia.

Na rozdiel od konvenčných úloh obnovy, ktoré možno vyriešiť učením pod dohľadom, degradácia skutočných fotografií je zložitá a doménová medzera medzi syntetickými obrázkami a skutočnými starými fotografiami spôsobuje, že sieť nedokáže zovšeobecniť.

Ich nová technika navrhuje novú trojitú doménovú prekladovú sieť využívaním skutočných fotografií spolu s masívnymi syntetickými pármi obrázkov. Konkrétne trénujú dva variačné automatické kódovače (VAE), aby transformovali staré fotografie a čisté fotografie do dvoch skrytých priestorov. A preklad medzi týmito dvoma latentnými priestormi sa učí pomocou syntetických spárovaných údajov.

Šesť rôznych obrázkov zobrazuje pôvodnú fotografiu a oveľa vylepšenú verziu po prejdení modelom. Prvý obrázok: vyblednutý obrázok, ak dievča drží kvety. Obrázok dva: Záber hlavy vyblednutej ženy, ktorá sa usmieva a drží vtáka posadeného na ruke pred tvárou. Obrázok XNUMX: vyblednutý a vyblednutý obraz mladého človeka s dlhými vlasmi a okuliarmi s núteným úsmevom. Obrázok štvrtý: Vyblednutý a vyblednutý obraz ženy v šatách so psom v lone. Obrázok XNUMX: Prasknutý a ohnutý čiernobiely obrázok chlapca, ktorý má na sebe vestu a košeľu. Obrázok šiesty: silne popraskaný čiernobiely obrázok páru. Muž nosí vintage vojenskú uniformu a žena vintage šaty. Všetky obrázky majú podobnú vysokú kvalitu s odstránením nedokonalostí po prejdení modelom.

Tento preklad sa dobre zovšeobecňuje na skutočné fotografie, pretože doménová medzera je uzavretá v kompaktnom latentnom priestore. Na riešenie viacerých degradácií zmiešaných v jednej starej fotografii navrhli globálnu vetvu s čiastočným nelokálnym blokovaním zameraným na štruktúrované defekty, ako sú škrabance a prachové škvrny, a lokálnu vetvu zameranú na neštruktúrované defekty, ako sú zvuky a rozmazanie. Dve vetvy sú spojené v latentnom priestore, čo vedie k zlepšenej schopnosti obnoviť staré fotografie z viacerých defektov. Navrhovaná metóda prevyšuje najmodernejšie metódy z hľadiska vizuálnej kvality pri reštaurovaní starých fotografií.

Pozrite si techniku ​​znázornenú na videu nižšie:

Bohužiaľ, Microsoft nesprístupnil demo stránku na vyskúšanie technológie, ale dúfajme, že spoločnosť túto nápovedu využije.

Prečítajte si oveľa viac podrobností v spoločnosti Microsoft tu.

Viac o témach: výskum spoločnosti Microsoft, reštaurovanie fotografií