Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/49514

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorCARVALHO, Francisco de Assis Tenório de-
dc.contributor.authorSÁ, José Nataniel Andrade de-
dc.date.accessioned2023-03-28T15:27:29Z-
dc.date.available2023-03-28T15:27:29Z-
dc.date.issued2023-02-24-
dc.identifier.citationSÁ, José Nataniel Andrade de. Modelos de co-clustering fuzzy baseados em kernel no espaço de características com ponderação automática das variáveis. 2023 Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/49514-
dc.description.abstractNesta dissertação, propomos métodos de co-clustering fuzzy baseados em kernel com ponderação automática das variáveis via distâncias adaptativas. Algoritmos de co-clustering realizam o agrupamento simultâneo de objetos e variáveis. Esses métodos organizam a matriz de dados em blocos homogêneos, conseguindo fornecer insights a respeito da associação entre objetos e variáveis. Funções kernel têm sido usadas com sucesso nos algoritmos de agrupa- mento convencional para mitigar o problema da separabilidade dos grupos, que também pode afetar os algoritmos de co-clustering. O uso de distâncias adaptativas nos permite aprender di- namicamente os pesos das variáveis durante o processo de otimização, levando a uma melhora no desempenho dos algoritmos. Distâncias adaptativas mudam a cada iteração do algoritmo e podem ser a mesma para todos os grupos (distância adaptativa global) ou diferentes de um grupo para outro (distância adaptativa local). Nesse sentido, três algoritmos foram propostos: (i) O Gaussian Kernel Fuzzy Double K-Means (GKFDK) é o algoritmo base, o qual combina co-clustering com o kernel gaussiano, mas considera que todas as variáveis são igualmente im- portantes na formação dos grupos de objetos. (ii) O Gaussian Kernel Fuzzy Double K-Means Based on Global Adaptive Distance (GKFDK-GP) é uma extensão do GKFDK que realiza a ponderação de variáveis. O GKFDK-GP considera que as variáveis têm o mesmo peso para todos os grupos de objetos. (iii) O Gaussian Kernel Fuzzy Double K-Means Based on Local Adaptive Distance (GKFDK-LP) também é uma extensão do GKFDK que realiza a pondera- ção de variáveis. Contudo, o GKFDK-LP considera que as variáveis têm pesos diferentes para cada grupo de objetos. Experimentos realizados com dados sintéticos e reais, em comparação com algoritmos de co-clustering e de agrupamento convencional do estado da arte, mostraram a eficácia dos algoritmos propostos. Os modelos com ponderação das variáveis apresentaram os melhores resultados no geral, onde o GKFDK-LP obteve o melhor desempenho entre todos, seguido do GKFDK-GP. O algoritmo base GKFDK obteve o terceiro melhor desempenho, em relação à maioria das métricas de avaliação.pt_BR
dc.description.sponsorshipFACEPEpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectCo-clusteringpt_BR
dc.titleModelos de co-clustering fuzzy baseados em kernel no espaço de características com ponderação automática das variáveispt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coFERREIRA, Marcelo Rodrigo Portela-
dc.contributor.authorLatteshttp://lattes.cnpq.br/0547822765322755pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3909162572623711pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxIn this dissertation, we propose kernel-based fuzzy co-clustering methods with automatic variable weighting via adaptive distances. Co-clustering algorithms perform simultaneous clus- tering of objects and variables. These methods organize the data matrix into homogeneous blocks, being able to provide insights about the association between objects and variables. Kernel functions have been successfully used in conventional clustering algorithms to mitigate the problem of cluster separability, which can also affect co-clustering algorithms. The use of adaptive distances allows us to dynamically learn the weights of the variables during the optimization process, leading to improved performance of the algorithms. Adaptive distances change with each iteration of the algorithm and can be the same for all clusters (global adap- tive distance) or different from one cluster to another (local adaptive distance). In this sense, three algorithms were proposed: (i) The Gaussian Kernel Fuzzy Double K-Means (GKFDK) is the base algorithm, which combines co-clustering with the Gaussian kernel, but considers that all variables are equally important in the formation of the clusters of objects. (ii) The Gaussian Kernel Fuzzy Double K-Means Based on Global Adaptive Distance (GKFDK-GP) is an extension of the GKFDK that performs variable weighting. The GKFDK-GP considers variables to have the same weight for all clusters of objects. (iii) The Gaussian Kernel Fuzzy Double K-Means Based on Local Adaptive Distance (GKFDK-LP) is also an extension of the GKFDK that performs variable weighting. However, GKFDK-LP considers that variables have different weights for each cluster of objects. Experiments performed with both synthetic and real datasets, in comparison with state-of-the-art co-clustering and conventional clustering algorithms, showed the effectiveness of the proposed algorithms. The models with variable weighting showed the best results overall, where GKFDK-LP performed best among all, fol- lowed by GKFDK-GP. The base algorithm GKFDK obtained the third best performance, with respect to most of the evaluation metrics.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/2620157217100077pt_BR
Aparece en las colecciones: Dissertações de Mestrado - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
DISSERTAÇÃO José Nataniel Andrade de Sá.pdf4,9 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons