Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/39284

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorCAVALCANTI, George Darmiton da Cunha-
dc.contributor.authorSOARES, Rodolfo José de Oliveira-
dc.date.accessioned2021-02-23T18:43:50Z-
dc.date.available2021-02-23T18:43:50Z-
dc.date.issued2020-10-07-
dc.identifier.citationSOARES, Rodolfo José de Oliveira. sPerC: um classificador baseado em perturbação para dados multimodais. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2020.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/39284-
dc.description.abstractNa literatura, a teoria bayesiana é amplamente utilizada como base para a geração de novos modelos supervisionados, dada sua robustez em diversos contextos. Entre as diferentes técnicas embasadas no modelo estatístico, o classificador baseado em perturbações (PerC, do inglês Perturbation-based Classifier) utiliza as alterações ocorridas nos parâmetros 𝜇^ e Σ^, chamadas de Δ𝜇^ e ΔΣ^, para rotular novas amostras, tendo seu desempenho comprovado em vários cenários. Entretanto, quando o PerC é submetido a problemas que seguem uma distribuição multimodal, sua performance, e seu poder de generalização, degradam. Neste contexto, a multimodalidade pode ser observada quando exemplos de uma mesma classe formam grupos (clusters) dispersos no espaço de características. Assim, a multimodalidade aumenta a complexidade dos dados, reduzindo o nível de discernimento dos vetores médios e matrizes de covariâncias estimadas pelo classificador PerC. Para preencher essa lacuna, este trabalho apresenta uma nova abordagem de classificação para o algoritmo PerC, intitulada sPerC (do inglês, subconcept PerC), no qual utiliza o algoritmo K-Means para particionar os dados do problema em clusters, fornecendo-os como entrada para a técnica PerC, com o intuito de aprimorar o poder de generalização do modelo. A partir da combinação de 4 diferentes clustering validation índices, o valor do parâmetro 𝐾 é estimado para o algoritmo K-Means. Vale destacar que nenhum conhecimento prévio, sobre os domínios em estudo, é levado em consideração ao definir o valor do parâmetro. Experimentos foram conduzidos usando 30 bases de dados disponíveis nos repositórios KEEL e UCI Machine Learning, comparando o desempenho do método proposto em relação as técnicas PerC (versão original), Árvore de Decisão, k-NN, Multilayer Perceptron (MLP), Naïve Bayes, Random Forest e Support Vector Machine (SVM). Os resultados demonstraram a eficácia do trabalho proposto, alcançando desempenho competitivos em relação aos métodos Random Forest e Árvore de Decisão, e sendo significativamente superior aos algoritmos PerC, MLP e SVM, segundo os testes estatísticos de Wilcoxon e Friedman. Por fim, 22 medidas de complexidade foram adotadas na extração de características das bases de dados e utilizadas na construção de um meta-learning dataset para descrever os cenários favoráveis para a aplicação do método sPerC, a partir de um meta-classificador.pt_BR
dc.description.sponsorshipFACEPEpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectPerturbaçõespt_BR
dc.subjectMultimodalidadept_BR
dc.subjectAgrupamento de dadospt_BR
dc.titlesPerC : um classificador baseado em perturbação para dados multimodaispt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coARAÚJO, Edson Leite-
dc.contributor.authorLatteshttp://lattes.cnpq.br/3400861579749571pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/8577312109146354pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxBayesian theory is widely used as a basis for generation of new supervised models, due to its robustness in different contexts. Among the different techniques based on the statistical model, the Perturbation-based Classifier (PerC) uses the changes in the parameters 𝜇^ and Σ^, called Δ𝜇^ and ΔΣ^, to label new samples. The PerC classifier has had its performance proven in several scenarios. However, when PerC is subjected to problems with multimodal distribution, its performance, and its power of generalization, degrades. In this context, multimodality can be observed when samples of the same class form clusters dispersed in the feature space. Thus, multimodality increases data complexity, reducing the level of discernment of the mean vectors and matrices of covariance estimated by the PerC classifier. To fill this gap, this paper presents a new classification approach for the PerC algorithm, namely sPerC (subconcept PerC), that uses the K-Means algorithm to partition the problem data in clusters and provide them as inputs to the PerC technique aiming to improve the generalization power of the model. From the combination of 4 different clustering validation indexes, the value of the K parameter is estimated for the K-Means algorithm. It is worth noting that no prior knowledge about the study’s domains is taken into consideration when setting the parameter value. Experiments were conducted using 30 datasets available in KEEL and UCI Machine Learning repositories to compare the performance of the proposed method with the PerC techniques (original version), Decision Tree, k-NN, Multilayer Perceptron (MLP), Naïve Bayes, Random Forest, and Support Vector Machine (SVM). The results of the experiments show the effectiveness of the proposed work as it achieved competitive performance in comparison to Random Forest and Decision Tree methods, and it was significantly superior to PerC, MLP, and SVM algorithms, according to Wilcoxon and Friedman statistical tests. Finally, 22 complexity measures were applied in the extraction of characteristics from the datasets and used in the construction of a meta-learning dataset to describe the favorable scenarios for the application of the sPerC method from a meta-classifier.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/9775974009786244pt_BR
Aparece en las colecciones: Dissertações de Mestrado - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
DISSERTAÇÃO Rodolfo José de Oliveira Soares.pdf1,27 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons