Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/33915
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | CARVALHO, Francisco de Assis Tenório de | - |
dc.contributor.author | GUSMÃO, Renê Pereira de | - |
dc.date.accessioned | 2019-09-27T20:55:12Z | - |
dc.date.available | 2019-09-27T20:55:12Z | - |
dc.date.issued | 2019-04-26 | - |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/33915 | - |
dc.description.abstract | O agrupamento de dados com múltiplas visões é um problema emergente e que vem sendo pesquisado nos últimos anos. Modelos para agrupamento de dados relacionais presentes na literatura apresentam rápida convergência e, consequentemente, o espaço de soluções não é explorado de forma adequada. Esta tese de doutorado teve como objetivo a investigação e desenvolvimento de métodos híbridos baseados em otimização por nuvem de partículas para resolver o problema do agrupamento de dados relacionais com múltiplas visões. Os métodos híbridos desenvolvidos combinam otimização por nuvem de partículas com métodos de agrupamento baseados em matrizes de dissimilaridades com o objetivo de se beneficiar das características de cada abordagem e explorar de melhor forma o espaço de soluções. A abordagem desenvolvida foi avaliada para agrupamento rígido e nebuloso de dados relacionais. Além disso, devido a importância da escolha de uma função de aptidão apropriada, diversos índices para validação de agrupamentos foram investigados e adaptados para considerar dissimilaridades fornecidas por várias matrizes bem como pesos de relevância para cada matriz. Seis estudos foram realizados para validação dos modelos híbridos desenvolvidos. No primeiro estudo, o modelo híbrido para agrupamento rígido de dados relacionais com única visão foi comparado a outros métodos da literatura e obteve resultados competitivos. No segundo estudo, os agrupamentos rígidos gerados por onze funções de aptidão para diversas bases de dados reais foram avaliados em termos dos índices externos medida F e índice ajustado de Rand tanto para o modelo que considera dados com única visão quanto para os modelos para dados com múltiplas visões. As funções de aptidão que se destacaram dentre as demais foram: índice da silhueta, índice de Xu e homogeneidade intra-cluster. Os resultados obtidos pelo índice da silhueta e pela homogeneidade foram selecionados para comparação com os resultados obtidos por outros métodos da literatura no terceiro estudo. Verificou-se que a abordagem proposta apresentou melhores resultados para a maioria dos casos analisados. Três estudos também foram realizados para validação dos modelos híbridos para agrupamento nebuloso de dados com única visão e com várias visões. As funções de aptidão para agrupamento nebuloso que se destacaram dentre as demais foram: silhueta simplificada e coeficiente da partição. A análise dos resultados mostrou que a abordagem proposta para agrupamento nebuloso também obteve desempenho competitivo e melhor em alguns casos em comparação a outros métodos da literatura. Os resultados demonstraram que o problema do agrupamento de dados relacionais com múltiplas visões pode ser melhorado de forma significativa através de métodos híbridos baseados em otimização de enxame. Portanto, tais achados reforçam a importância da aplicação de técnicas tais como algoritmos baseados em otimização de enxame no campo da mineração de dados. | pt_BR |
dc.description.sponsorship | FACEPE | pt_BR |
dc.language.iso | por | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Inteligência computacional | pt_BR |
dc.subject | Otimização | pt_BR |
dc.subject | Análise de cluster | pt_BR |
dc.title | Métodos híbridos para agrupamento de dados relacionais com múltiplas visões | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/5859661975093751 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | doutorado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/3909162572623711 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | Clustering of multi-view data is an emerging problem that has been researched in recent years. Existing models for relational data clustering in the literature present fast convergence and, consequently, the solution space is not adequately explored. This thesis aimed at the investigation and development of hybrid methods based on particle swarm optimization to solve the problem of clustering multi-view relational data. The hybrid methods developed combine particle swarm optimization with clustering methods based on dissimilarity matrices in order to benefit from the characteristics of each approach and to better exploit the solution space. The approach developed was evaluated for hard and fuzzy clustering of relational data. In addition, due to the importance of choosing an appropriate fitness function, several clustering validation indices have been investigated and adapted to consider dissimilarities provided by several matrices as well as relevance weights for each matrix. Six studies were carried out to validate the hybrid models developed. In the first study, the hybrid model for rigid clustering of single-view relational data was compared to other methods in the literature and obtained competitive results. In the second study, the hard clusterings generated by eleven fitness functions for various real data sets were evaluated in terms of the external indexes F-measure and Adjusted Rand index for both the model that considers single-view data and the models for multi-view data. The fitness functions that stood out among the others were: silhouette index, Xu index and intracluster homogeneity. The results obtained by the silhouette index and homogeneity were selected for comparison with the results obtained by other methods of the literature in the third study. It was found that the proposed approach presented better results for most of the cases analyzed. Three studies were also carried out to validate hybrid models for fuzzy clustering of single-view data and multi-view data. The fitness functions for fuzzy clustering that stood out among others were: simplified silhouette and partition coefficient. The analysis of the results showed that the approach proposed for fuzzy clustering also obtained competitive performance and better in some cases in comparison with other methods of the literature. The results demonstrated that the problem of clustering multi-view relational data can be significantly improved through hybrid methods based on swarm optimization. Therefore, the results reinforce the importance of the application of techniques such as algorithms based on swarm optimization in the field of data mining. | pt_BR |
Aparece nas coleções: | Teses de Doutorado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TESE Renê Pereira de Gusmão.pdf | 4,41 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons