Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/47361

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorREN, Tsang Ing-
dc.contributor.authorVARGAS, Kevin Ian Ruiz-
dc.date.accessioned2022-11-08T11:27:51Z-
dc.date.available2022-11-08T11:27:51Z-
dc.date.issued2022-08-08-
dc.identifier.citationVARGAS, Kevin Ian Ruiz. UR-SRGAN: a generative adversarial network for real-world super-resolution with a U-Net-based discriminator. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/47361-
dc.description.abstractDespite several improvements in Super-Resolution deep learning techniques, these proposed methods tend to fail in many real-world scenarios since their models are usually trained using a pre-defined degradation process from high-resolution (HR) ground truth images to low-resolution (LR) ones. In this work, we propose a supervised Generative Adversarial Network (GAN) model for Image Super-Resolution which has as the first stage to estimate blur kernels and noise estimation from real-world images to generate LR images for the training phase. Furthermore, the proposal includes implementing a novel U-Net-based discriminator, to consider an input image’s global and local context, and it allows employing a CutMix data augmentation for consistency regularization in the two-dimensional output space of the decoder. The proposed model was applied to three main datasets that are ordinarily used in super-resolution official competitions. The commonly-used evaluation metrics for image restoration were used for this evaluation: Peak Signal-to-Noise Ratio (PSNR), Structural Similarity (SSIM), Learned Perceptual Image Patch Similarity (LPIPS) and Natural Image Quality Evaluator (NIQE). After implementing this new architecture, three other prominent models in the state-of-the-art GAN proposals for super-resolution were trained with the same parameters and databases to perform a global comparison between all of them. Finally, the results of the experimentation in training and evaluation tasks between all the models suggest an improvement in the performance of the presented work compared to the other architectures based on the established metrics.pt_BR
dc.description.sponsorshipCAPESpt_BR
dc.language.isoengpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectResolução de imagempt_BR
dc.subjectModelagempt_BR
dc.titleUR-SRGAN : a generative adversarial network for real-world super-resolution with a U-Net-based discriminatorpt_BR
dc.typemasterThesispt_BR
dc.contributor.authorLatteshttps://lattes.cnpq.br/6685368039034715pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3084134533707587pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxApesar de várias melhorias nas técnicas de aprendizado profundo de super-resolução, esses métodos propostos tendem a falhar em muitos cenários do mundo real, pois seus modelos geralmente são treinados usando um processo de degradação predefinido de imagens de verdade de alta resolução - High Resolution (HR) para baixa resolução - Low Resolution (LR). Neste trabalho, propomos um modelo supervisionado de Generative Ad-versarial Network (GAN) para Super-Resolução de Imagem que tem como primeira etapa estimar kernels de borramento e estimativa de ruído de imagens do mundo real para gerar imagens LR para a fase de treinamento. Além disso, a proposta inclui a implementação de um novo discriminador baseado em U-Net, para considerar o contexto global e local de uma imagem de entrada, e permite empregar um aumento de dados CutMix para regularização de consistência no espaço de saída bidimensional do decodificador. O modelo proposto foi aplicado a três conjuntos de dados principais que são normalmente usados em competições oficiais de super-resolução. As métricas de avaliação comumente usadas para restauração de imagem foram usadas para esta avaliação: Peak Signal-to-Noise Ra-tio (PSNR), Structural Similarity (SSIM), Learned Perceptual Image Patch Similarity (LPIPS) e Natural Image Quality Evaluator (NIQE). Após a implementação desta nova arquitetura, três outros modelos de destaque nas propostas GAN de super-resolução de última geração foram treinados com os mesmos parâmetros e bancos de dados para realizar uma comparação global entre todos eles. Por fim, os resultados da experimentação em tarefas de treinamento e avaliação entre todos os modelos sugerem uma melhora no desempenho do trabalho apresentado em relação às demais arquiteturas baseadas nas métricas estabelecidas.pt_BR
Aparece nas coleções:Dissertações de Mestrado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Kevin Ian Ruiz Vargas.pdf4,4 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons