Uma abordagem de seleção dinâmica de classificadores para predição de defeitos de software

AVELINO JÚNIOR, Juscelino Sebastião

Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/45634

Share on

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	CAVALCANTI, George Darmiton da Cunha	-
dc.contributor.author	AVELINO JÚNIOR, Juscelino Sebastião	-
dc.date.accessioned	2022-08-11T15:24:25Z	-
dc.date.available	2022-08-11T15:24:25Z	-
dc.date.issued	2022-03-16	-
dc.identifier.citation	AVELINO JÚNIOR, Juscelino Sebastião. Uma abordagem de seleção dinâmica de classificadores para predição de defeitos de software. 2022. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2022.	pt_BR
dc.identifier.uri	https://repositorio.ufpe.br/handle/123456789/45634	-
dc.description.abstract	A predição de defeitos é uma tarefa que visa alocar recursos e informações para predizer módulos de software propensos a defeitos. Contudo, devido a necessidade de quantidades sufi- cientemente grandes de dados requeridas pelos modelos, pesquisadores tem se concentrado em pesquisas sobre Cross-Project Defect Prediction (CPDP). Essa abordagem envolve construir modelos usando um conjunto de treinamento composto por informações de diversos projetos externos. Diversas abordagens CPDP propostas na literatura utilizam abordagens tradicionais como, por exemplo, normalização/transformação dos dados através do logaritmo ou uso de algoritmos de aprendizagem de máquina. Entretanto, essas abordagens não possuem nenhum mecanismo capaz de selecionar um classificador ou um conjunto de classificadores mais apto em predizer uma determinada amostra de teste. Logo, a seleção dinâmica de classificadores é uma abordagem ao qual seleciona classificadores básicos em tempo real de acordo com cada amostra de teste a ser classificada. Neste contexto e considerando as limitações das abor- dagens CPDP tradicionais, propomos uma abordagem CPDP que, com base nos dados de treinamento, seleciona a melhor configuração de parâmetros (técnica de seleção dinâmica de classificadores × classificador básico × tamanho do pool de classificadores) para classificar as novas amostras de entrada (dados de teste). A abordagem proposta é composta por três etapas: Definição do Alvo, Superprodução e Avaliação do Modelo. Portanto, nessa dissertação são almejados quatro principais pontos. Primeiro, é conduzida uma análise experimental para investigar o comportamento da abordagem proposta na predição de defeitos de software. Se- gundo, são realizadas comparações entre a abordagem proposta versus abordagens CPDP da literatura. Neste contexto, foram investigados quais métodos apresentam melhor desempenho para os mesmos conjuntos de dados ou projetos de software. Terceiro, para verificar a precisão de classificação dos métodos CPDP, foi analisada a qualidade da performance dos métodos em relação à algumas escalas da área sob a curva ROC (ROC-AUC). Quarto, foi realizada uma análise experimental para verificar quando utilizar a abordagem proposta. Neste ponto, utilizamos um meta-classificador (árvore de decisão) que, através de regras de decisão, define quais características dos dados a abordagem proposta deve ser aplicada e, consequentemente, apresentar maior desempenho.	pt_BR
dc.description.sponsorship	FACEPE	pt_BR
dc.language.iso	por	pt_BR
dc.publisher	Universidade Federal de Pernambuco	pt_BR
dc.rights	openAccess	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Inteligência computacional	pt_BR
dc.subject	Predição de defeitos de software	pt_BR
dc.subject	Predição de defeitos cruzada entre projetos	pt_BR
dc.subject	Seleção dinâmica de classificadores	pt_BR
dc.title	Uma abordagem de seleção dinâmica de classificadores para predição de defeitos de software	pt_BR
dc.type	masterThesis	pt_BR
dc.contributor.authorLattes	http://lattes.cnpq.br/6515167340670153	pt_BR
dc.publisher.initials	UFPE	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.degree.level	mestrado	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/8577312109146354	pt_BR
dc.publisher.program	Programa de Pos Graduacao em Ciencia da Computacao	pt_BR
dc.description.abstractx	Defect prediction is a task that aims to allocate resources and information to predict defect- prone software modules. However, due to the need for sufficiently large amounts of data required by the models, researchers have focused on research on Cross-Project Defect Pre- diction (CPDP). This approach involves building models using a training set composed of information from multiple external projects. Several CPDP approaches proposed in the lit- erature use traditional approaches such as log normalization/transformation of data or use of machine learning algorithms, however, these approaches have no mechanism to select a classifier or a set of classifiers that are best able to predict a given test sample. Therefore, dynamic classifier selection is an approach that selects basic classifiers in real time according to each test sample to be classified. In this context and considering the limitations of traditional CPDP approaches, we propose a CPDP approach that, based on training data, selects the best parameter configuration (dynamic classifier selection technique × basic classifier × size of the pool of classifiers) to classify the new input samples (test data). The proposed approach is composed of three steps: Target Definition, Overproduction and Model Evaluation. Therefore, four main points are targeted in this dissertation. First, an experimental analysis is conducted to investigate the behavior of the proposed approach in predicting software defects. Second, comparisons are conducted between the proposed approach versus CPDP approaches from the literature. In this context, it was investigated which methods perform better for the same datasets or software designs. Third, to verify the classification accuracy of CPDP methods, the quality of the methods’ performance against some scales of the area under the ROC curve (ROC-AUC) was analyzed. Fourth, an experimental analysis was performed to verify when to use the proposed approach. Here, we used a meta-classifier (decision tree) that, through decision rules, defines which characteristics of the data the proposed approach should apply and, consequently, present higher performance.	pt_BR
Appears in Collections:	Dissertações de Mestrado - Ciência da Computação

Files in This Item:

File	Description	Size	Format
DISSERTAÇÃO Juscelino Sebastião Avelino Júnior.pdf		1.95 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show simple item record Recommend this item

This item is licensed under a Creative Commons License