Microsoft Research entwickelt einen erstaunlichen Fotowiederherstellungsalgorithmus

Symbol für die Lesezeit 2 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Mehr erfahren

Das Microsoft-Forschungsteam Ziyu Wan, Bo Zhang und andere haben einen neuen KI-basierten Algorithmus zur Wiederherstellung alter Fotos entwickelt, die durch einen Deep-Learning-Ansatz stark beschädigt wurden.

Im Gegensatz zu herkömmlichen Restaurierungsaufgaben, die durch überwachtes Lernen gelöst werden können, ist die Verschlechterung echter Fotos komplex, und die Domänenlücke zwischen synthetischen Bildern und echten alten Fotos lässt das Netzwerk nicht verallgemeinern.

Ihre neue Technik schlägt ein neuartiges Triplett-Domain-Translation-Netzwerk vor, indem sie echte Fotos zusammen mit massiven synthetischen Bildpaaren nutzt. Konkret trainieren sie zwei Variations-Autoencoder (VAEs), alte Fotos bzw. saubere Fotos in zwei latente Räume umzuwandeln. Und die Übersetzung zwischen diesen beiden latenten Räumen wird mit synthetischen gepaarten Daten gelernt.

Sechs verschiedene Bilder zeigen das Originalfoto und eine stark verbesserte Version, nachdem sie das Modell durchlaufen haben. Bild eins: ein verblasstes Bild, wenn ein Mädchen Blumen hält. Bild zwei: Ein Kopfschuss einer verblassten Frau, die lächelt und einen Vogel auf ihrer Hand vor ihrem Gesicht hält. Bild drei: ein verblasstes und verfärbtes Bild einer jungen Person mit langen Haaren und Brille mit einem gezwungenen Lächeln. Bild vier: Ein verblasstes und verfärbtes Bild einer Frau, die ein Kleid mit einem Hund auf dem Schoß trägt. Bild fünf: Ein rissiges und verbogenes Schwarz-Weiß-Bild eines Jungen, der eine Weste und ein Hemd trägt. Bild sechs: ein stark zersprungenes Schwarz-Weiß-Bild eines Paares. Der Mann trägt eine Vintage-Militäruniform und die Frau trägt ein Vintage-Kleid. Alle Bilder haben eine ähnlich hohe Qualität mit entfernten Mängeln, nachdem sie das Modell durchlaufen haben.

Diese Übersetzung lässt sich gut auf echte Fotos verallgemeinern, da die Domänenlücke im kompakten latenten Raum geschlossen wird. Um mehrere in einem alten Foto vermischte Verschlechterungen zu beheben, entwarfen sie einen globalen Zweig mit einem teilweisen nichtlokalen Block, der auf die strukturierten Defekte wie Kratzer und Staubflecken abzielt, und einen lokalen Zweig, der auf die unstrukturierten Defekte wie Rauschen und Unschärfe abzielt. Die beiden Zweige werden im latenten Raum verschmolzen, was zu einer verbesserten Fähigkeit führt, alte Fotos von mehreren Defekten wiederherzustellen. Das vorgeschlagene Verfahren übertrifft modernste Methoden in Bezug auf die visuelle Qualität für die Restaurierung alter Fotos.

Sehen Sie sich die im Video unten gezeigte Technik an:

Leider hat Microsoft keine Demoseite zur Verfügung gestellt, um die Technologie auszuprobieren, aber hoffentlich nimmt das Unternehmen den Hinweis auf.

Lesen Sie viel ausführlicher bei Microsoft hier.

Benutzerforum

0 Nachrichten