Microsoft Research vyvinul úžasný algoritmus pro obnovu fotografií

Ikona času čtení 2 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více

Výzkumný tým společnosti Microsoft Ziyu Wan, Bo Zhang a další vyvinuli nový algoritmus založený na umělé inteligenci pro obnovu starých fotografií, které trpí vážným poškozením prostřednictvím přístupu hlubokého učení.

Na rozdíl od konvenčních restaurátorských úkolů, které lze řešit pomocí učení pod dohledem, je degradace u skutečných fotografií složitá a doménová mezera mezi syntetickými obrázky a skutečnými starými fotografiemi způsobuje, že síť se nedaří zobecnit.

Jejich nová technika navrhuje novou trojici doménových překladových sítí využitím skutečných fotografií spolu s masivními syntetickými páry obrázků. Konkrétně trénují dva variační autokodéry (VAE), aby transformovaly staré fotografie a čisté fotografie do dvou latentních prostorů. A překlad mezi těmito dvěma latentními prostory se učí pomocí syntetických spárovaných dat.

Šest různých obrázků ukazuje původní fotografii a mnohem vylepšenou verzi po projetí modelu. První obrázek: vybledlý obrázek dívky držící květiny. Obrázek druhý: Záběr hlavy vybledlé ženy, která se usmívá a drží ptáka posazeného na ruce před obličejem. Obrázek třetí: vybledlý a vybledlý obrázek mladého člověka s dlouhými vlasy a brýlemi s nuceným úsměvem. Obrázek čtvrtý: Vybledlý a vybledlý obrázek ženy v šatech se psem na klíně. Obrázek XNUMX: Prasklý a ohnutý černobílý obrázek chlapce ve vestě a košili. Obrázek šest: silně popraskaný černobílý obrázek páru. Muž nosí vintage vojenskou uniformu a žena nosí vintage šaty. Všechny obrázky mají podobně vysokou kvalitu s odstraněnými nedokonalostmi po průchodu modelem.

Tento překlad se dobře zobecňuje na skutečné fotografie, protože doménová mezera je uzavřena v kompaktním latentním prostoru. Aby se vypořádali s několika degradacemi smíchanými v jedné staré fotografii, navrhli globální větev s částečným nelokálním blokovým zacílením na strukturované defekty, jako jsou škrábance a prachové skvrny, a místní větev zacílenou na nestrukturované defekty, jako jsou zvuky a rozmazání. Dvě větve jsou sloučeny v latentním prostoru, což vede k lepší schopnosti obnovit staré fotografie z více defektů. Navržená metoda předčí nejmodernější metody z hlediska vizuální kvality restaurování starých fotografií.

Podívejte se na techniku ​​demonstrovanou ve videu níže:

Společnost Microsoft bohužel nezpřístupnila demo stránku, kde by technologii vyzkoušela, ale doufejme, že společnost tuto nápovědu přijme.

Přečtěte si mnohem více podrobností v Microsoft zde.

Více o tématech: průzkum společnosti Microsoft, restaurování fotografií