Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/35371

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorZANCHETTIN, Cleber-
dc.contributor.authorSOUZA, Thiago Vinicius Machado de-
dc.date.accessioned2019-11-29T17:32:54Z-
dc.date.available2019-11-29T17:32:54Z-
dc.date.issued2019-02-26-
dc.identifier.citationSOUZA, Thiago Vinicius Machado de. Utilizando Spatial Transformer Networks no agrupamento de imagens baseado em Deep Adaptive Clustering. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/35371-
dc.description.abstractO agrupamento de imagens é uma tarefa importante e desafiadora na aprendizagem de máquina. Como na maioria das áreas de processamento de imagens, as últimas melhorias foram obtidas a partir de modelos baseados em aprendizagem profunda. No entanto, os métodos clássicos de aprendizagem profunda têm dificuldade para lidar com transformações espaciais nas imagens de entrada como, por exemplo, escala e rotação. Nesta dissertação, propomos o uso de técnicas de atenção visual para reduzir este problema em métodos de agrupamento profundo de imagens. Nossa hipótese de pesquisa sugere que adicionar camadas de atenção visual em arquiteturas de deep image clustering pode tornar os modelos robustos a pequenas variações espaciais nos dados de entrada da rede e melhorar seu desempenho. Avaliamos a combinação de um modelo de agrupamento profundo chamado Deep Adaptive Clustering (DAC) com o módulo de atenção visual Spatial Transformer Networks (STN). O modelo proposto é avaliado nos conjuntos de dados MNIST e FashionMNIST e superou o modelo de referência nos experimentos realizados. Adicionalmente realizamos diversos experimentos qualitativos para investigar o funcionamento da arquitetura proposta.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectAgrupamento de imagenspt_BR
dc.titleUtilizando Spatial Transformer Networks no agrupamento de imagens baseado em Deep Adaptive Clusteringpt_BR
dc.typemasterThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/9835223450599059pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1244195230407619pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxImage clustering is an important but challenging task in machine learning. As in most image processing areas, the latest improvements came from models based on the deep learning approach. However, classical deep learning methods have problems to deal with spatial image transformations like scale and rotation in input images. In this dissertation, we propose the use of visual attention techniques to reduce this problem in deep image clustering methods. Our research hypothesis suggests that adding visual attention layers to deep image clustering architectures can make models more robusts to small spatial variations in the input data of the network and improve their performance. We evaluate the combination of a deep image clustering model called Deep Adaptive Clustering (DAC) with the visual attention module Spatial Transformer Networks (STN). The proposed model is evaluated in the datasets MNIST and FashionMNIST and outperformed the baseline model in the performed experiments. In addition, we performed several qualitative experiments to investigate the operation of the proposed architecture.pt_BR
Aparece nas coleções:Dissertações de Mestrado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Thiago Vinicius Machado de Souza.pdf4,94 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons