Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/47361
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | REN, Tsang Ing | - |
dc.contributor.author | VARGAS, Kevin Ian Ruiz | - |
dc.date.accessioned | 2022-11-08T11:27:51Z | - |
dc.date.available | 2022-11-08T11:27:51Z | - |
dc.date.issued | 2022-08-08 | - |
dc.identifier.citation | VARGAS, Kevin Ian Ruiz. UR-SRGAN: a generative adversarial network for real-world super-resolution with a U-Net-based discriminator. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/47361 | - |
dc.description.abstract | Despite several improvements in Super-Resolution deep learning techniques, these proposed methods tend to fail in many real-world scenarios since their models are usually trained using a pre-defined degradation process from high-resolution (HR) ground truth images to low-resolution (LR) ones. In this work, we propose a supervised Generative Adversarial Network (GAN) model for Image Super-Resolution which has as the first stage to estimate blur kernels and noise estimation from real-world images to generate LR images for the training phase. Furthermore, the proposal includes implementing a novel U-Net-based discriminator, to consider an input image’s global and local context, and it allows employing a CutMix data augmentation for consistency regularization in the two-dimensional output space of the decoder. The proposed model was applied to three main datasets that are ordinarily used in super-resolution official competitions. The commonly-used evaluation metrics for image restoration were used for this evaluation: Peak Signal-to-Noise Ratio (PSNR), Structural Similarity (SSIM), Learned Perceptual Image Patch Similarity (LPIPS) and Natural Image Quality Evaluator (NIQE). After implementing this new architecture, three other prominent models in the state-of-the-art GAN proposals for super-resolution were trained with the same parameters and databases to perform a global comparison between all of them. Finally, the results of the experimentation in training and evaluation tasks between all the models suggest an improvement in the performance of the presented work compared to the other architectures based on the established metrics. | pt_BR |
dc.description.sponsorship | CAPES | pt_BR |
dc.language.iso | eng | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Inteligência computacional | pt_BR |
dc.subject | Resolução de imagem | pt_BR |
dc.subject | Modelagem | pt_BR |
dc.title | UR-SRGAN : a generative adversarial network for real-world super-resolution with a U-Net-based discriminator | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.authorLattes | https://lattes.cnpq.br/6685368039034715 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | mestrado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/3084134533707587 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | Apesar de várias melhorias nas técnicas de aprendizado profundo de super-resolução, esses métodos propostos tendem a falhar em muitos cenários do mundo real, pois seus modelos geralmente são treinados usando um processo de degradação predefinido de imagens de verdade de alta resolução - High Resolution (HR) para baixa resolução - Low Resolution (LR). Neste trabalho, propomos um modelo supervisionado de Generative Ad-versarial Network (GAN) para Super-Resolução de Imagem que tem como primeira etapa estimar kernels de borramento e estimativa de ruído de imagens do mundo real para gerar imagens LR para a fase de treinamento. Além disso, a proposta inclui a implementação de um novo discriminador baseado em U-Net, para considerar o contexto global e local de uma imagem de entrada, e permite empregar um aumento de dados CutMix para regularização de consistência no espaço de saída bidimensional do decodificador. O modelo proposto foi aplicado a três conjuntos de dados principais que são normalmente usados em competições oficiais de super-resolução. As métricas de avaliação comumente usadas para restauração de imagem foram usadas para esta avaliação: Peak Signal-to-Noise Ra-tio (PSNR), Structural Similarity (SSIM), Learned Perceptual Image Patch Similarity (LPIPS) e Natural Image Quality Evaluator (NIQE). Após a implementação desta nova arquitetura, três outros modelos de destaque nas propostas GAN de super-resolução de última geração foram treinados com os mesmos parâmetros e bancos de dados para realizar uma comparação global entre todos eles. Por fim, os resultados da experimentação em tarefas de treinamento e avaliação entre todos os modelos sugerem uma melhora no desempenho do trabalho apresentado em relação às demais arquiteturas baseadas nas métricas estabelecidas. | pt_BR |
Aparece nas coleções: | Dissertações de Mestrado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Kevin Ian Ruiz Vargas.pdf | 4,4 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons