Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/45634

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorCAVALCANTI, George Darmiton da Cunha-
dc.contributor.authorAVELINO JÚNIOR, Juscelino Sebastião-
dc.date.accessioned2022-08-11T15:24:25Z-
dc.date.available2022-08-11T15:24:25Z-
dc.date.issued2022-03-16-
dc.identifier.citationAVELINO JÚNIOR, Juscelino Sebastião. Uma abordagem de seleção dinâmica de classificadores para predição de defeitos de software. 2022. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/45634-
dc.description.abstractA predição de defeitos é uma tarefa que visa alocar recursos e informações para predizer módulos de software propensos a defeitos. Contudo, devido a necessidade de quantidades sufi- cientemente grandes de dados requeridas pelos modelos, pesquisadores tem se concentrado em pesquisas sobre Cross-Project Defect Prediction (CPDP). Essa abordagem envolve construir modelos usando um conjunto de treinamento composto por informações de diversos projetos externos. Diversas abordagens CPDP propostas na literatura utilizam abordagens tradicionais como, por exemplo, normalização/transformação dos dados através do logaritmo ou uso de algoritmos de aprendizagem de máquina. Entretanto, essas abordagens não possuem nenhum mecanismo capaz de selecionar um classificador ou um conjunto de classificadores mais apto em predizer uma determinada amostra de teste. Logo, a seleção dinâmica de classificadores é uma abordagem ao qual seleciona classificadores básicos em tempo real de acordo com cada amostra de teste a ser classificada. Neste contexto e considerando as limitações das abor- dagens CPDP tradicionais, propomos uma abordagem CPDP que, com base nos dados de treinamento, seleciona a melhor configuração de parâmetros (técnica de seleção dinâmica de classificadores × classificador básico × tamanho do pool de classificadores) para classificar as novas amostras de entrada (dados de teste). A abordagem proposta é composta por três etapas: Definição do Alvo, Superprodução e Avaliação do Modelo. Portanto, nessa dissertação são almejados quatro principais pontos. Primeiro, é conduzida uma análise experimental para investigar o comportamento da abordagem proposta na predição de defeitos de software. Se- gundo, são realizadas comparações entre a abordagem proposta versus abordagens CPDP da literatura. Neste contexto, foram investigados quais métodos apresentam melhor desempenho para os mesmos conjuntos de dados ou projetos de software. Terceiro, para verificar a precisão de classificação dos métodos CPDP, foi analisada a qualidade da performance dos métodos em relação à algumas escalas da área sob a curva ROC (ROC-AUC). Quarto, foi realizada uma análise experimental para verificar quando utilizar a abordagem proposta. Neste ponto, utilizamos um meta-classificador (árvore de decisão) que, através de regras de decisão, define quais características dos dados a abordagem proposta deve ser aplicada e, consequentemente, apresentar maior desempenho.pt_BR
dc.description.sponsorshipFACEPEpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectPredição de defeitos de softwarept_BR
dc.subjectPredição de defeitos cruzada entre projetospt_BR
dc.subjectSeleção dinâmica de classificadorespt_BR
dc.titleUma abordagem de seleção dinâmica de classificadores para predição de defeitos de softwarept_BR
dc.typemasterThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/6515167340670153pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/8577312109146354pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxDefect prediction is a task that aims to allocate resources and information to predict defect- prone software modules. However, due to the need for sufficiently large amounts of data required by the models, researchers have focused on research on Cross-Project Defect Pre- diction (CPDP). This approach involves building models using a training set composed of information from multiple external projects. Several CPDP approaches proposed in the lit- erature use traditional approaches such as log normalization/transformation of data or use of machine learning algorithms, however, these approaches have no mechanism to select a classifier or a set of classifiers that are best able to predict a given test sample. Therefore, dynamic classifier selection is an approach that selects basic classifiers in real time according to each test sample to be classified. In this context and considering the limitations of traditional CPDP approaches, we propose a CPDP approach that, based on training data, selects the best parameter configuration (dynamic classifier selection technique × basic classifier × size of the pool of classifiers) to classify the new input samples (test data). The proposed approach is composed of three steps: Target Definition, Overproduction and Model Evaluation. Therefore, four main points are targeted in this dissertation. First, an experimental analysis is conducted to investigate the behavior of the proposed approach in predicting software defects. Second, comparisons are conducted between the proposed approach versus CPDP approaches from the literature. In this context, it was investigated which methods perform better for the same datasets or software designs. Third, to verify the classification accuracy of CPDP methods, the quality of the methods’ performance against some scales of the area under the ROC curve (ROC-AUC) was analyzed. Fourth, an experimental analysis was performed to verify when to use the proposed approach. Here, we used a meta-classifier (decision tree) that, through decision rules, defines which characteristics of the data the proposed approach should apply and, consequently, present higher performance.pt_BR
Aparece nas coleções:Dissertações de Mestrado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Juscelino Sebastião Avelino Júnior.pdf1,95 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons