Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/53504
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | SOUZA, Renata Maria Cardoso Rodrigues de | - |
dc.contributor.author | TEOTONIO, Gabriel Harrison Fidelis | - |
dc.date.accessioned | 2023-11-08T17:37:34Z | - |
dc.date.available | 2023-11-08T17:37:34Z | - |
dc.date.issued | 2023-05-25 | - |
dc.identifier.citation | TEOTONIO, Gabriel Harrison Fidelis. Variable weighted fuzzy clustering algorithm for qualitative data. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/53504 | - |
dc.description.abstract | This work focuses on the clustering methods within unsupervised learning, a challenging sub-division of Machine Learning where there is no response variable available. Clustering is a technique for finding groups in a dataset, where the observations in each group are similar to each other and different from those in other groups. The K-Means method, recognized as the most well-known and widely used clustering technique, efficiently handles quantitative variables, like many other existing clustering methods. However, the K-Means algorithm cannot be used with qualitative variables, such as gender or education level. To overcome this limitation, the K-Modes method was proposed, which uses modes instead of means to represent the clusters. The existing partitional clustering algorithms without variable weighting have a limitation in that they assign equal importance to all variables. It can be problematic when clustering high-dimensional, sparse data where the characterization of cluster partitions can be explained by a particular subset of variables. To address this issue, subspace clustering techniques and adaptive distances have been proposed, with the latter being derived from constraints based on the sum and product of the weights relative to the importance of the variables. This work proposes a new fuzzy clustering algorithm for qualitative data based on adaptive distances, which demonstrates improved performance compared to conventional methods. The local adaptive distances, which assign different weights to each variable across the clusters, perform better for datasets with high levels of dispersion and overlap of classes. The results extend the capabilities of existing clustering algorithms based on adaptive distances. | pt_BR |
dc.description.sponsorship | CNPq | pt_BR |
dc.language.iso | eng | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | embargoedAccess | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Inteligência computacional | pt_BR |
dc.subject | Agrupamento | pt_BR |
dc.title | Variable weighted fuzzy clustering algorithm for qualitative data | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.advisor-co | AMARAL, Getúlio José Amorim do | - |
dc.contributor.authorLattes | http://lattes.cnpq.br/3723910313293363 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | mestrado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/9289080285504453 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | Este trabalho se concentra nos métodos de agrupamento dentro do aprendizado não supervisionado, uma subdivisão desafiadora da Aprendizagem de Máquina onde não há variável resposta disponível. O agrupamento é uma técnica para encontrar grupos em um conjunto de dados, onde as observações em cada grupo são semelhantes umas às outras e diferentes das observações em outros grupos. O método K-Means, reconhecido como a técnica de agrupamento mais conhecida e amplamente utilizada, lida de forma eficiente com variáveis quantitativas, assim como muitos outros métodos de agrupamento existentes. No entanto, o algoritmo K-Means não pode ser usado com variáveis qualitativas, como gênero ou nível de educação. Para superar esta limitação, foi proposto o método K-Modes, que usa modas em vez de médias para representar os grupos. Os algoritmos de agrupamento particional existentes sem ponderação variável têm a limitação de atribuir importância igual a todas as variáveis. Isso pode ser problemático ao agrupar dados de alta dimensão e esparsos, onde a caracterização das partições do agrupamento pode ser explicada por um subconjunto particular de variáveis. Para abordar este problema, foram propostas técnicas de agrupamento de subespaço e distâncias adaptativas, sendo estas últimas derivadas a partir de restrições baseadas na soma e no produto dos pesos relativos à importância das variáveis. Este trabalho propõe um novo algoritmo de agrupamento difuso para dados qualitativos baseado em distâncias adaptativas, o qual demonstra desempenho melhorado em comparação aos métodos convencionais. As distâncias adaptativas locais, que atribuem pesos diferentes para cada variável em relação aos grupos, apresentam melhor desempenho para conjuntos de dados com altos níveis de dispersão e sobreposição de classes. Os resultados ampliam as capacidades dos algoritmos de agrupamento existentes baseados em distâncias adaptativas. | pt_BR |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/7674916684282039 | pt_BR |
Aparece nas coleções: | Dissertações de Mestrado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇAO Gabriel Harrison Fidelis Teotonio.pdf Item embargado até 2025-10-26 | 830,66 kB | Adobe PDF | Visualizar/Abrir Item embargado |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons