Please use this identifier to cite or link to this item:
https://repositorio.ufpe.br/handle/123456789/65490
Share on
Title: | Detecção de conflitos semânticos com testes de unidade gerados por LLM |
Authors: | BARBOSA, Nathalia Fernanda de Araújo Barbosa |
Keywords: | Conflitos semânticos de código; Geração de testes de unidade; LLMs |
Issue Date: | 11-Aug-2025 |
Citation: | BARBOSA, Nathalia Fernanda de Araújo. Detecção de conflitos semânticos com testes de unidade gerados por LLM. 2025. Trabalho de Conclusão de Curso (Engenharia da Computação) – Universidade Federal de Pernambuco, Recife, 2025. |
Abstract: | Conflitos semânticos ocorrem quando um desenvolvedor introduz mudanças em uma base de código que afetam, de maneira não intencional, o comportamento de mudanças integradas em paralelo por outros desenvolvedores. Como as ferramentas de merge usadas na prática não conseguem detectar esse tipo de conflito, foram propostas ferramentas complementares, como o SMAT, que é baseada na geração e execução de testes de unidade — se um teste falha na versão base do código, passa na versão modificada por um desenvolvedor, mas falha novamente na versão resultante do merge dessa com a de outro desenvolvedor, sinaliza-se um conflito semântico. Apesar de apresentar boa capacidade de detecção de conflitos, o SMAT apresenta alta taxa de falsos negativos (conflitos existentes, mas não sinalizados pela mesma). Parte desse problema deve-se às limitações naturais de ferramentas de geração de testes de unidade, no caso, Randoop e Evosuite. Para entender se essas limitações podem ser superadas por modelos de linguagem de grande porte (LLMs), este trabalho propõe, e integra ao SMAT, uma nova ferramenta de geração de testes baseada no Code Llama 70B. Exploramos então a capacidade desse modelo de gerar testes, com diferentes estratégias de interação, prompts com diferentes conteúdos, e diferentes configurações de parâmetros do modelo. Avaliamos os resultados com duas amostras distintas: um benchmark com sistemas mais simples, usados em trabalhos relacionados, e uma amostra mais significativa baseada em sistemas complexos e utilizados na prática. Por fim, avaliamos a eficácia da nova extensão do SMAT na detecção de conflitos. Os resultados indicam que, embora a geração de testes por LLM em cenários complexos ainda represente um desafio e seja computacionalmente custosa, há potencial promissor na identificação de conflitos semânticos. |
URI: | https://repositorio.ufpe.br/handle/123456789/65490 |
Appears in Collections: | (TCC) - Engenharia da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TCC Nathalia Fernanda de Araújo Barbosa.pdf | 923,01 kB | Adobe PDF | ![]() View/Open |
This item is protected by original copyright |
This item is licensed under a Creative Commons License