Adversarial oversampling : um método para balanceamento baseado em Redes Neurais Adversárias

LIMA, Jefferson Luiz Pessoa

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/39224

Comparte esta pagina

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.advisor	MATTOS NETO, Paulo Salgado Gomes de	-
dc.contributor.author	LIMA, Jefferson Luiz Pessoa	-
dc.date.accessioned	2021-02-17T12:49:52Z	-
dc.date.available	2021-02-17T12:49:52Z	-
dc.date.issued	2020-09-29	-
dc.identifier.citation	LIMA, Jefferson Luiz Pessoa. Adversarial oversampling: um método para balanceamento baseado em redes neurais adversárias. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2020.	pt_BR
dc.identifier.uri	https://repositorio.ufpe.br/handle/123456789/39224	-
dc.description.abstract	Base de dados com diferentes proporções de exemplos por classe é algo frequente e pode afetar negativamente alguns algoritmos de aprendizagem supervisionada. Uma série de classificadores podem ficar enviesados quando são treinados nessas condições, especializando-se somente nas classes com maior quantidade de amostras, deixando de lado as classes minoritárias, as quais podem ser mais importantes para o objetivo em questão. Esse problema exige um esforço considerável de investigação e estudo para elaboração de métodos. Como nem sempre é possível, ou viável, a coleta de novas amostras da classe minoritária, métodos têm sido estudados e desenvolvidos para realizar a geração de amostras a partir das existentes, fazendo o chamado Oversampling. Utilizando as Generative Adversarial Networks - GANs, as quais compõem o estado da arte para geração de amostras sintéticas realistas, o presente trabalho propôs o método Adversarial Oversampling - AO. O método proposto utiliza as Auxiliary Classifier GANs - AC-GAN como rede adversária, para aprender a distribuição das classes e gerar amostras sintéticas para balancear a base de dados. Durante o treinamento do AO, é dado uma maior atenção às amostras consideradas difíceis, utilizando a própria rede adversária para determinar a dificuldade dessas amostras. Com isso, o AO tenta gerar amostras mais significativas, que colaboram para melhorar a região de fronteira do classificador em questão. As amostras sintéticas geradas são filtradas utilizando a rede adversário do AO. A primeira análise realizada teve como objetivo observar a morfologia das amostras geradas pelo Oversampling, e mostrou que o AO conseguiu gerar amostras com um aspecto visual mais fiel às amostras originais, comparado aos métodos tradicionais de Oversampling, que possuem a geração baseada em interpolação. Uma segunda análise foi feita para observar a precisão do classificador na classe minoritária à medida que são inseridas as amostras geradas pelo AO. Por fim, foi feito um experimento comparativo entre os métodos de Oversampling, observando o quão as amostras geradas contribuem para o aumento na precisão do classificador na classe minoritária. Esse experimento foi repetido em cinco bases de dados de imagens. Os resultados médios do AO mostraram indícios de superioridade em quatro das cinco das bases, em até 4%. Com base nos indícios obtidos através dos experimentos realizados, pode-se observar que o método proposto pode ser capaz de gerar amostras sintéticas, balanceando a distribuição das classes e contribuindo no processo de aprendizagem do classificador.	pt_BR
dc.description.sponsorship	CAPES	pt_BR
dc.language.iso	por	pt_BR
dc.publisher	Universidade Federal de Pernambuco	pt_BR
dc.rights	openAccess	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Inteligência computacional	pt_BR
dc.subject	Redes neurais	pt_BR
dc.title	Adversarial oversampling : um método para balanceamento baseado em Redes Neurais Adversárias	pt_BR
dc.type	masterThesis	pt_BR
dc.contributor.advisor-co	SALES, Fernando José Ribeiro	-
dc.contributor.authorLattes	http://lattes.cnpq.br/8138557692742391	pt_BR
dc.publisher.initials	UFPE	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.degree.level	mestrado	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/4610098557429398	pt_BR
dc.publisher.program	Programa de Pos Graduacao em Ciencia da Informacao	pt_BR
dc.description.abstractx	Datasets with different proportions of examples per class are common and negatively affect some supervised learning algorithms. Some classifiers can be biased when trained in these conditions, specializing only in classes with a greater number of samples, leaving aside minority classes, which may be more important for the objective in question. This problem requires considerable research and study effort to develop methods. How is not always possible, or feasible, to collect new samples from the minority class, the methods have been studied for generating samples from existing ones. Using the Generative Adversarial Networks - GANs, which are the state of the art for generating realistic synthetic samples, the present work proposed the Adversarial Oversampling - AO method. The proposed method use the Auxiliary Classifier GANs - AC-GAN as an opposing network, to learn the distribution of classes and generate synthetic samples to balance the dataset, focusing on the minority class. During the training of AO, a preference is given to hardest samples, using the Discriminator D network to determine the difficulty of these samples. Further AO tries to generate more significant samples, which collaborate to improve the decision region of the classifier. The generated synthetic samples are filtered using the AO adversary network. The first analysis performedaimed to observe the morphology of the images samples generated by Oversampling and showed that AO generate samples with a visual aspect more faithful to the original samples, compared to traditional methods of Oversampling, which have an interpolation-based generation. A second analysis was made to observe the classifier’s accuracy in the minority class as the samples generated by AO are inserted. Finally, a comparative experiment was performed between the Oversampling methods, observing how the generated samples contribute to the classifier accuracy in the minority class. This experiment was repeated in five image datasets. The average results of AO showed evidence of superiority in four of the five datasets, up to 4%. Based on the evidence obtained through the experiments, the proposed method may be able to generate synthetic samples, balancing the the classes proportion, and contributing to the learning process of the classifier.	pt_BR
dc.contributor.advisor-coLattes	http://lattes.cnpq.br/2763370548436903	pt_BR
Aparece en las colecciones:	Dissertações de Mestrado - Ciência da Computação

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
DISSERTAÇÃO Jefferson Luiz Pessoa Lima.pdf		4,62 MB	Adobe PDF	Visualizar/Abrir

Este ítem está protegido por copyright original

Visualizar la licencia

Mostrar el registro sencillo del ítem Recomiende este ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons