Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/65738

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorZANCHETTIN, Cleber-
dc.contributor.authorPEIXINHO, Pedro Henrique Almeida Girão-
dc.date.accessioned2025-09-03T16:11:46Z-
dc.date.available2025-09-03T16:11:46Z-
dc.date.issued2025-08-04-
dc.date.submitted2025-09-02-
dc.identifier.citationPEIXINHO, Pedro Henrique Almeida Girão. Estudo comparativo do desempenho de LLMs na classificação da origem de erros em pipelines de IDP. 2025. 22 f. TCC (Graduação) - Curso de Engenharia da Computação, Universidade Federal de Pernambuco, Recife, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/65738-
dc.description.abstractO diagnóstico de erros em sistemas de Processamento Inteligente de Documentos (IDP) é um processo majoritariamente manual, lento e custoso, representando um gargalo para a manutenção e evolução desses sistemas. Este trabalho investiga a automação dessa tarefa através da aplicação de Grandes Modelos de Linguagem (LLMs). Foi conduzido um estudo comparativo entre os modelos GPT-4o, Claude Sonnet 4 e Gemini 2.5 Pro para classificar a origem de falhas em três categorias — Erro de Extração, Erro de Relação e Erro da Aplicação — utilizando uma engenharia de prompts baseada em raciocínio algorítmico. Os resultados demonstram a alta eficácia da abordagem, com o modelo Gemini 2.5 Pro alcançando um F1-Score de 0.94, superando significativamente não apenas os outros LLMs, mas também um baseline heurístico (F1-Score de 0.51). A solução proposta atingiu uma redução de aproximadamente 82% no tempo de análise em comparação com um baseline temporal, validando a metodologia como uma alternativa de alto desempenho e eficiente para otimizar os ciclos de manutenção de sistemas de IDP.pt_BR
dc.format.extent22p.pt_BR
dc.language.isoporpt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/pt_BR
dc.subjectGrandes Modelos de Linguagempt_BR
dc.subjectProcessamento Inteligente de Documentospt_BR
dc.subjectEngenharia de promptpt_BR
dc.subjectDiagnóstico de errospt_BR
dc.titleEstudo comparativo do desempenho de LLMs na classificação da origem de erros em pipelines de IDPpt_BR
dc.typebachelorThesispt_BR
dc.contributor.authorLatteshttps://lattes.cnpq.br/7795663436745077pt_BR
dc.degree.levelGraduacaopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1244195230407619pt_BR
dc.description.abstractxError diagnosis in Intelligent Document Processing (IDP) systems is a predominantly manual, slow, and costly process, representing a bottleneck for the maintenance and evolution of these systems. This work investigates the automation of this task through the application of Large Language Models (LLMs). A comparative study was conducted between the GPT-4o, Claude Sonnet 4, and Gemini 2.5 Pro models to classify the origin of failures into three categories — Extraction Error, Relation Error, and Application Error — using a prompt engineering methodology based on algorithmic reasoning. The results demonstrate the high effectiveness of the approach, with the Gemini 2.5 Pro model achieving an F1-Score of 0.94, significantly outperforming not only the other LLMs but also a heuristic baseline (F1-Score of 0.51). The proposed solution achieved a reduction of approximately 82% in analysis time compared to a temporal baseline, validating the methodology as a high-performance and efficient alternative for optimizing the maintenance cycles of IDP systems.pt_BR
dc.subject.cnpqÁreas::Ciências Exatas e da Terra::Ciência da Computaçãopt_BR
dc.degree.departament::(CIN-DCC) - Departamento de Ciência da Computaçãopt_BR
dc.degree.graduation::CIn-Curso de Engenharia da Computaçãopt_BR
dc.degree.grantorUniversidade Federal de Pernambucopt_BR
dc.degree.localRecifept_BR
Aparece en las colecciones: (TCC) - Engenharia da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TCC Pedro Henrique Almeida Girão Peixinho.pdf451,81 kBAdobe PDFVisualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons