Algoritmos particionais semissupervisionados com ponderação automática de variáveis

MACARIO FILHO, Valmir

Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/15260

Share on

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	CARVALHO, Francisco de Assis Tenório de	-
dc.contributor.author	MACARIO FILHO, Valmir	-
dc.date.accessioned	2016-02-19T18:48:11Z	-
dc.date.available	2016-02-19T18:48:11Z	-
dc.date.issued	2015-01-10	-
dc.identifier.uri	https://repositorio.ufpe.br/handle/123456789/15260	-
dc.description.abstract	Nas aplicações tradicionais de aprendizagem de máquina, os classificadores utilizam ape- nas dados rotulados em seu treinamento. Os dados rotulados, por sua vez, são difíceis, caros, consomem tempo e requerem especialistas humanos para serem obtidos em algu- mas aplicações reais. Entretanto, dados não rotulados são abundantes e fáceis de serem obtidos mas há poucas abordagens que os utilizam no treinamento. Para contornar esse problema existe a aprendizagem semissupervisionada. A aprendizagem semissupervisio- nada utiliza dados não rotulados, juntamente com dados rotulados, com a finalidade de melhorar o desempenho dos algoritmos. A abordagem semissupervisionada, geralmente, obtém resultados melhores do que se utilizassem apenas poucos padrões rotulados em uma abordagem supervisionada ou se utilizassem apenas padrões não rotulados numa abordagem não supervisionada. Um algoritmo semissupervisionado pode se basear em algoritmos de agrupamento não supervisionado, geralmente, adicionando-se um termo ou estratégia que faz uso de informações rotuladas para guiar o processo de aprendizagem deste algoritmo. Os algoritmos de agrupamento são bastante influenciados pelo cálculo da similaridade entre dois items, ou seja, a distância entre dois itens. Quando o algoritmo semissupervisionado é um extensão de um algoritmo de agrupamento, este também é bastante influenciado por esta distância. Desse modo, distâncias adaptativas são utiliza- das para que o algoritmo tenha capacidade de se adequar a diferentes distribuições dos dados, geralmente, melhorando o desempenho em relação aos algoritmos que não utili- zam uma distância adaptativa. Este trabalho apresenta novos algoritmos de agrupamento semissupervisionado baseados no algoritmo Fuzzy C-Means que utilizam distâncias adap- tativas com ponderação automática de variáveis. Estudos experimentais no contexto da aprendizagem a partir de dados parcialmente rotulados são apresentados. Além disso, o comportamento dos algoritmos é discutido e os resultados examinados através de testes estatísticos de Friedman. Desse modo, foi possível certificar que os novos algoritmos de agrupamento semissupervisionado com distâncias adaptativas apresentam desempenho melhor que algoritmos já consolidados na literatura.	pt_BR
dc.description.sponsorship	FACEPE	pt_BR
dc.language.iso	por	pt_BR
dc.publisher	UNIVERSIDADE FEDERAL DE PERNAMBUCO	pt_BR
dc.rights	openAccess	pt_BR
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Ciência da computação	pt_BR
dc.subject	Inteligência artificial	pt_BR
dc.subject	Sistemas difusos	pt_BR
dc.title	Algoritmos particionais semissupervisionados com ponderação automática de variáveis	pt_BR
dc.type	doctoralThesis	pt_BR
dc.contributor.authorLattes	http://lattes.cnpq.br/4346898674852080	pt_BR
dc.publisher.initials	UFPE	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.degree.level	doutorado	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/3909162572623711	pt_BR
dc.publisher.program	Programa de Pos Graduacao em Ciencia da Computacao	pt_BR
dc.description.abstractx	In traditional machine learning applications, one uses only labeled data to train the al- gorithm. Labeled data are difficult, expensive, time consuming and require human ex- perts to be obtained in some real applications. However, unlabeled data are abundant and easy to be obtained but there has been few approaches to use them in training. Semi-supervised learning addresses this problem. The semi-supervised learning uses large amount of unlabeled data, together with the labeled data, to build better algorithms. The semi-supervised approach, usually, obtains better results than if using a few labeled patterns in a supervised approach or using only standard not supervised approach. The semi-supervised algorithm can be an extension of an unsupervised algorithm. Such algo- rithm can be based on unsupervised clustering algorithms, adding a term or strategy, that makes use of labeled information to guide the learning process of the algorithm. Unsuper- vised algorithms are greatly influenced by calculating the similarity between two items, ie, the distance between two items. When the semi-supervised algorithm is an extension of an unsupervised algorithm, it is also quite influenced by this distance. Thus, adaptive distances are utilized, so the algorithm is able to adapt to different data distributions, gen- erally improving performance compared to algorithms that use the standard Euclidean distance. This work presents new algorithms for semi-supervised clustering based on Fuzzy C-Means algorithm using adaptive distances with automatic variable weighting. Exper- imental studies in the context of learning from partially labeled data are presented. In addition, the behavior of the algorithm is discussed and the results are investigated using the Friedman Test. Thus, it was possible to certify that the performance of the new semi- supervised clustering algorithms are better than other consolidated algorithms.	pt_BR
Appears in Collections:	Teses de Doutorado - Ciência da Computação

Files in This Item:

File	Description	Size	Format
TESE Valmir Macario Filho.pdf		4.14 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show simple item record Recommend this item

This item is licensed under a Creative Commons License