Microsoft Research phát triển thuật toán khôi phục ảnh tuyệt vời

Biểu tượng thời gian đọc 2 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Nhóm nghiên cứu của Microsoft Ziyu Wan, Bo Zhang, và những người khác đã phát triển một thuật toán dựa trên AI mới để khôi phục các bức ảnh cũ bị xuống cấp nghiêm trọng thông qua phương pháp học sâu.

Không giống như các nhiệm vụ khôi phục thông thường có thể được giải quyết thông qua học có giám sát, sự xuống cấp trong ảnh thực rất phức tạp và khoảng cách miền giữa ảnh tổng hợp và ảnh cũ thực khiến mạng không thể tổng quát hóa.

Kỹ thuật mới của họ đề xuất một mạng dịch ba miền mới lạ bằng cách tận dụng các bức ảnh thực cùng với các cặp hình ảnh tổng hợp lớn. Cụ thể, họ đào tạo hai bộ mã tự động biến thể (VAE) để lần lượt chuyển đổi ảnh cũ và ảnh sạch thành hai không gian tiềm ẩn. Và phép dịch giữa hai không gian tiềm ẩn này được học với dữ liệu ghép nối tổng hợp.

Sáu hình ảnh khác nhau hiển thị ảnh gốc và một phiên bản cải tiến nhiều sau khi được chạy qua mô hình. Hình ảnh một: một hình ảnh mờ nhạt nếu một cô gái cầm hoa. Hình ảnh hai: Ảnh chụp trực diện một người phụ nữ mờ nhạt đang mỉm cười và cầm một con chim đậu trên tay trước mặt. Hình ảnh thứ ba: hình ảnh một người trẻ tuổi với mái tóc dài và đeo kính với nụ cười gượng gạo. Hình ảnh thứ tư: Hình ảnh một người phụ nữ mặc váy với một con chó trong lòng đã bị mờ và biến màu. Hình ảnh năm: Hình ảnh một cậu bé mặc vest và váy sơ mi đen trắng bị nứt và bị bẻ cong. Hình ảnh thứ sáu: một hình ảnh đen trắng bị rạn nứt nghiêm trọng của một cặp vợ chồng. Người đàn ông mặc một bộ quân phục cổ điển và người phụ nữ mặc một chiếc váy cổ điển. Tất cả các hình ảnh đều có chất lượng cao như nhau với các khuyết điểm được loại bỏ sau khi chạy qua mô hình.

Bản dịch này tổng quát tốt cho ảnh thực vì khoảng cách miền được đóng lại trong không gian tiềm ẩn nhỏ gọn. Để giải quyết nhiều hiện tượng xuống cấp lẫn trong một bức ảnh cũ, họ đã thiết kế một nhánh toàn cầu với một phần khối phi địa phương nhắm mục tiêu đến các khuyết tật có cấu trúc, chẳng hạn như vết xước và vết bụi, và một nhánh cục bộ nhắm mục tiêu đến các khuyết tật không có cấu trúc, chẳng hạn như tiếng ồn và mờ. Hai nhánh được hợp nhất trong không gian tiềm ẩn, dẫn đến cải thiện khả năng khôi phục các bức ảnh cũ từ nhiều lỗi. Phương pháp được đề xuất vượt trội hơn các phương pháp hiện đại về chất lượng hình ảnh để phục chế ảnh cũ.

Xem kỹ thuật được trình bày trong video dưới đây:

Thật không may, Microsoft đã không cung cấp một trang web demo để thử công nghệ này, nhưng hy vọng, công ty sẽ đưa ra gợi ý.

Đọc thêm nhiều chi tiết tại Microsoft tại đây.

Diễn đàn người dùng

Tin nhắn 0