Microsoft Research udvikler en fantastisk fotogendannelsesalgoritme

Ikon for læsetid 2 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

Microsofts forskningsteam Ziyu Wan, Bo Zhang og flere har udviklet en ny AI-baseret algoritme til at gendanne gamle fotos, der lider under alvorlig forringelse gennem en dyb læringstilgang.

I modsætning til konventionelle restaureringsopgaver, der kan løses gennem overvåget læring, er nedbrydningen i rigtige fotos kompleks, og domænegabet mellem syntetiske billeder og rigtige gamle fotos gør, at netværket ikke kan generalisere.

Deres nye teknik foreslår et nyt triplet-domæneoversættelsesnetværk ved at udnytte rigtige fotos sammen med massive syntetiske billedpar. Specifikt træner de to variationelle autoencodere (VAE'er) til henholdsvis at omdanne gamle fotos og rene fotos til to latente rum. Og oversættelsen mellem disse to latente rum læres med syntetiske parrede data.

Seks forskellige billeder viser det originale foto og en meget forbedret version efter at være kørt igennem modellen. Billede et: et falmet billede, hvis en pige holder blomster. Billede to: Et hovedbillede af en falmet kvinde, der smiler og holder en fugl på hånden foran hendes ansigt. Billede tre: et falmet og misfarvet billede af en ung person med langt hår og briller med et tvungent smil. Billede fire: Et falmet og misfarvet billede af en kvinde iført en kjole med en hund i skødet. Billede fem: Et revnet og bøjet sort/hvidt billede af en dreng iført vest og skjorte. Billede seks: et stærkt revnet sort/hvid billede af et par. Manden bærer en vintage militæruniform, og kvinden bærer en vintage kjole. Alle billederne har en lignende høj kvalitet med ufuldkommenheder fjernet efter at være kørt gennem modellen.

Denne oversættelse generaliserer godt til rigtige fotos, fordi domænegabet er lukket i det kompakte latente rum. For at imødegå flere nedbrydninger blandet i ét gammelt foto, designede de en global gren med en delvis ikke-lokal blok målrettet mod de strukturerede defekter, såsom ridser og støvpletter, og en lokal gren, der målrettede mod de ustrukturerede defekter, såsom støj og sløring. De to grene er smeltet sammen i det latente rum, hvilket fører til forbedret evne til at gendanne gamle fotos fra flere defekter. Den foreslåede metode udkonkurrerer state-of-the-art metoder med hensyn til visuel kvalitet til restaurering af gamle fotos.

Se teknikken demonstreret i videoen nedenfor:

Desværre har Microsoft ikke stillet en demo-side til rådighed for at prøve teknologien, men forhåbentlig vil virksomheden tage tippet.

Læs meget mere detaljeret hos Microsoft her.

Mere om emnerne: Microsoft-forskning, foto restaurering