Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/15260
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | CARVALHO, Francisco de Assis Tenório de | - |
dc.contributor.author | MACARIO FILHO, Valmir | - |
dc.date.accessioned | 2016-02-19T18:48:11Z | - |
dc.date.available | 2016-02-19T18:48:11Z | - |
dc.date.issued | 2015-01-10 | - |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/15260 | - |
dc.description.abstract | Nas aplicações tradicionais de aprendizagem de máquina, os classificadores utilizam ape- nas dados rotulados em seu treinamento. Os dados rotulados, por sua vez, são difíceis, caros, consomem tempo e requerem especialistas humanos para serem obtidos em algu- mas aplicações reais. Entretanto, dados não rotulados são abundantes e fáceis de serem obtidos mas há poucas abordagens que os utilizam no treinamento. Para contornar esse problema existe a aprendizagem semissupervisionada. A aprendizagem semissupervisio- nada utiliza dados não rotulados, juntamente com dados rotulados, com a finalidade de melhorar o desempenho dos algoritmos. A abordagem semissupervisionada, geralmente, obtém resultados melhores do que se utilizassem apenas poucos padrões rotulados em uma abordagem supervisionada ou se utilizassem apenas padrões não rotulados numa abordagem não supervisionada. Um algoritmo semissupervisionado pode se basear em algoritmos de agrupamento não supervisionado, geralmente, adicionando-se um termo ou estratégia que faz uso de informações rotuladas para guiar o processo de aprendizagem deste algoritmo. Os algoritmos de agrupamento são bastante influenciados pelo cálculo da similaridade entre dois items, ou seja, a distância entre dois itens. Quando o algoritmo semissupervisionado é um extensão de um algoritmo de agrupamento, este também é bastante influenciado por esta distância. Desse modo, distâncias adaptativas são utiliza- das para que o algoritmo tenha capacidade de se adequar a diferentes distribuições dos dados, geralmente, melhorando o desempenho em relação aos algoritmos que não utili- zam uma distância adaptativa. Este trabalho apresenta novos algoritmos de agrupamento semissupervisionado baseados no algoritmo Fuzzy C-Means que utilizam distâncias adap- tativas com ponderação automática de variáveis. Estudos experimentais no contexto da aprendizagem a partir de dados parcialmente rotulados são apresentados. Além disso, o comportamento dos algoritmos é discutido e os resultados examinados através de testes estatísticos de Friedman. Desse modo, foi possível certificar que os novos algoritmos de agrupamento semissupervisionado com distâncias adaptativas apresentam desempenho melhor que algoritmos já consolidados na literatura. | pt_BR |
dc.description.sponsorship | FACEPE | pt_BR |
dc.language.iso | por | pt_BR |
dc.publisher | UNIVERSIDADE FEDERAL DE PERNAMBUCO | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Ciência da computação | pt_BR |
dc.subject | Inteligência artificial | pt_BR |
dc.subject | Sistemas difusos | pt_BR |
dc.title | Algoritmos particionais semissupervisionados com ponderação automática de variáveis | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/4346898674852080 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | doutorado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/3909162572623711 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | In traditional machine learning applications, one uses only labeled data to train the al- gorithm. Labeled data are difficult, expensive, time consuming and require human ex- perts to be obtained in some real applications. However, unlabeled data are abundant and easy to be obtained but there has been few approaches to use them in training. Semi-supervised learning addresses this problem. The semi-supervised learning uses large amount of unlabeled data, together with the labeled data, to build better algorithms. The semi-supervised approach, usually, obtains better results than if using a few labeled patterns in a supervised approach or using only standard not supervised approach. The semi-supervised algorithm can be an extension of an unsupervised algorithm. Such algo- rithm can be based on unsupervised clustering algorithms, adding a term or strategy, that makes use of labeled information to guide the learning process of the algorithm. Unsuper- vised algorithms are greatly influenced by calculating the similarity between two items, ie, the distance between two items. When the semi-supervised algorithm is an extension of an unsupervised algorithm, it is also quite influenced by this distance. Thus, adaptive distances are utilized, so the algorithm is able to adapt to different data distributions, gen- erally improving performance compared to algorithms that use the standard Euclidean distance. This work presents new algorithms for semi-supervised clustering based on Fuzzy C-Means algorithm using adaptive distances with automatic variable weighting. Exper- imental studies in the context of learning from partially labeled data are presented. In addition, the behavior of the algorithm is discussed and the results are investigated using the Friedman Test. Thus, it was possible to certify that the performance of the new semi- supervised clustering algorithms are better than other consolidated algorithms. | pt_BR |
Aparece nas coleções: | Teses de Doutorado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TESE Valmir Macario Filho.pdf | 4,14 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons