Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/65738
Comparte esta pagina
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | ZANCHETTIN, Cleber | - |
dc.contributor.author | PEIXINHO, Pedro Henrique Almeida Girão | - |
dc.date.accessioned | 2025-09-03T16:11:46Z | - |
dc.date.available | 2025-09-03T16:11:46Z | - |
dc.date.issued | 2025-08-04 | - |
dc.date.submitted | 2025-09-02 | - |
dc.identifier.citation | PEIXINHO, Pedro Henrique Almeida Girão. Estudo comparativo do desempenho de LLMs na classificação da origem de erros em pipelines de IDP. 2025. 22 f. TCC (Graduação) - Curso de Engenharia da Computação, Universidade Federal de Pernambuco, Recife, 2025. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/65738 | - |
dc.description.abstract | O diagnóstico de erros em sistemas de Processamento Inteligente de Documentos (IDP) é um processo majoritariamente manual, lento e custoso, representando um gargalo para a manutenção e evolução desses sistemas. Este trabalho investiga a automação dessa tarefa através da aplicação de Grandes Modelos de Linguagem (LLMs). Foi conduzido um estudo comparativo entre os modelos GPT-4o, Claude Sonnet 4 e Gemini 2.5 Pro para classificar a origem de falhas em três categorias — Erro de Extração, Erro de Relação e Erro da Aplicação — utilizando uma engenharia de prompts baseada em raciocínio algorítmico. Os resultados demonstram a alta eficácia da abordagem, com o modelo Gemini 2.5 Pro alcançando um F1-Score de 0.94, superando significativamente não apenas os outros LLMs, mas também um baseline heurístico (F1-Score de 0.51). A solução proposta atingiu uma redução de aproximadamente 82% no tempo de análise em comparação com um baseline temporal, validando a metodologia como uma alternativa de alto desempenho e eficiente para otimizar os ciclos de manutenção de sistemas de IDP. | pt_BR |
dc.format.extent | 22p. | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | pt_BR |
dc.subject | Grandes Modelos de Linguagem | pt_BR |
dc.subject | Processamento Inteligente de Documentos | pt_BR |
dc.subject | Engenharia de prompt | pt_BR |
dc.subject | Diagnóstico de erros | pt_BR |
dc.title | Estudo comparativo do desempenho de LLMs na classificação da origem de erros em pipelines de IDP | pt_BR |
dc.type | bachelorThesis | pt_BR |
dc.contributor.authorLattes | https://lattes.cnpq.br/7795663436745077 | pt_BR |
dc.degree.level | Graduacao | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/1244195230407619 | pt_BR |
dc.description.abstractx | Error diagnosis in Intelligent Document Processing (IDP) systems is a predominantly manual, slow, and costly process, representing a bottleneck for the maintenance and evolution of these systems. This work investigates the automation of this task through the application of Large Language Models (LLMs). A comparative study was conducted between the GPT-4o, Claude Sonnet 4, and Gemini 2.5 Pro models to classify the origin of failures into three categories — Extraction Error, Relation Error, and Application Error — using a prompt engineering methodology based on algorithmic reasoning. The results demonstrate the high effectiveness of the approach, with the Gemini 2.5 Pro model achieving an F1-Score of 0.94, significantly outperforming not only the other LLMs but also a heuristic baseline (F1-Score of 0.51). The proposed solution achieved a reduction of approximately 82% in analysis time compared to a temporal baseline, validating the methodology as a high-performance and efficient alternative for optimizing the maintenance cycles of IDP systems. | pt_BR |
dc.subject.cnpq | Áreas::Ciências Exatas e da Terra::Ciência da Computação | pt_BR |
dc.degree.departament | ::(CIN-DCC) - Departamento de Ciência da Computação | pt_BR |
dc.degree.graduation | ::CIn-Curso de Engenharia da Computação | pt_BR |
dc.degree.grantor | Universidade Federal de Pernambuco | pt_BR |
dc.degree.local | Recife | pt_BR |
Aparece en las colecciones: | (TCC) - Engenharia da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TCC Pedro Henrique Almeida Girão Peixinho.pdf | 451,81 kB | Adobe PDF | Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons