Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/64920
Comparte esta pagina
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | REN, Tsang Ing | - |
dc.contributor.author | CRISTOVÃO, Charles Gabriel Carvalho | - |
dc.date.accessioned | 2025-08-07T15:57:57Z | - |
dc.date.available | 2025-08-07T15:57:57Z | - |
dc.date.issued | 2025-04-03 | - |
dc.date.submitted | 2025-04-11 | - |
dc.identifier.citation | CRISTOVAO, Charles G. C.; REN, Tsang Ing. Comparative benchmarking of retrieval-augmented generation reranker for medical domain. 2025. Trabalho de Conclusão de Curso (Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2025 | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/64920 | - |
dc.description | 9,5 | pt_BR |
dc.description.abstract | The exponential growth of digital medical information poses significant challenges in delivering reliable, evidence-based responses to clinical inquiries. Traditional systems often fall short in bridging the gap between vast data repositories and the need for authoritative, contextually relevant insights. In this study, we introduce a pipeline that leverages a Retrieval-Augmented Generation reranker architecture, combined with a Chain-of-Thought (CoT) prompting strategy, to enhance the performance of Large Language Models in addressing complex medical questions. By integrating a robust retrieval mechanism that sources trustworthy evidence from established medical literature and by refining the information with reranking, our approach not only improves answer accuracy but also demonstrates that larger models can be effectively distilled into smaller, more resource-efficient variants while maintaining comparable performance. The pipeline is evaluated in zero-shot question-answering scenarios, employing a question-only retrieval strategy to simulate realistic clinical contexts where prior domain-specific fine-tuning is absent. This work underscores the potential of combining retrieval techniques with sequential reasoning to overcome the inherent challenges in medical AI, paving the way for more accurate, transparent, and accessible systems in healthcare applications. | pt_BR |
dc.format.extent | 14p. | pt_BR |
dc.language.iso | eng | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | pt_BR |
dc.subject | Retrieval Augmented Generation | pt_BR |
dc.subject | Zero shot Question Answering | pt_BR |
dc.subject | Large Language Models | pt_BR |
dc.subject | Model Benchmarking | pt_BR |
dc.subject | Chain of Thought | pt_BR |
dc.title | Comparative benchmarking of retrieval-augmented generation reranker for medical domain | pt_BR |
dc.type | bachelorThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/0584418432535071 | pt_BR |
dc.degree.level | Graduacao | pt_BR |
dc.contributor.advisorLattes | https://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723420U2&tokenCaptchar=03AFcWeA51yoC1oQDbWoyrGypOjBF0-qOrwGpyv6MPXsDeY2biWAECHynTwU9u16QklN5C0hvK17umg1G1wiMmInJbnAeBV67SYzRFljaDqyFaqF8S77XOEQ_LkKbiQUAbBvnHcTXJugBM9Mllq7poEX5IrLqFPsVOJ40KdE48B_IStfXU0FjwiPRri9UZqMOAXgCxJ5NuCiZni3X9cxfocovEnxLuoYCt7JngB49BqMOCNinMxcmXOituG9x77elOcsLzQNNDvEY0wR-JuuAJ4IzvA0BBhXIore9f0E4JoH1WSdVERpOP_4aBvGsVJsKAMXqtSLa9vzdw3AkEmW_mbT0_OQFthsyVrlw3lHsRailvd1NDMI9GCWqY3e1jgSYMwy55flcG0rtTtx-X7deGGY8qeXP1bmCfahFEpqRZIIq3I7GQt_wkttKj4JkqykbNHzMFTH7ZNwqEu5CrRMKDl4VDe7MlziruNqBAmmlVR_3z2MbqRMQ-ukRcK0DO-W4dTahbr93sl49HL8SQui6owscbdhOIMAZm3fQbPRjsw1V52wAdl-tpAtqSs4CAk06e0erUK7hd9ZqNb-I4GHvFv8EPylIlKEWOnD7IMzl8UMJ-UwTo7qy6IoeEWtv5Ax-0ETCg9eMLtcpljq-Ujj7TTKj41JJ1Txk0JKpP8Kz4VCcXsNf27di1T_G-IXnOFq5EkdOy_eV1bLqj-zaVyZ0zAzpGT2OTLCQ8stI_J3PbG1icFRmELEosQFBLKYlAn8ybiKuDWWCStuWJEwj3NBCP5I80amJFSO2PLrEo5uUwKf70tqQ-kfM22epvwS_DOnmJ2IwMv4MLm2mD-HCczlUC3k6cZ6XmxcUByWcghrr4PPsUZvOmXDfjb4qg9ov1_69Qm-eNnn3G4PPq3T4OjoH6BpWv3Z-6kbvWSd8WykDsGCA23yfIr3G4jxM | pt_BR |
dc.description.abstractx | O crescimento exponencial de informações médicas digitais apresenta desafios significativos na entrega de respostas confiáveis e baseadas em evidências para consultas clínicas. Sistemas tradicionais frequentemente falham em preencher a lacuna entre vastos repositórios de dados e a necessidade de insights contextualmente relevantes e autorizados. Neste estudo, apresentamos um pipeline que utiliza uma arquitetura de Retrieval-Augmented Generation (RAG) com rerranqueamento, combinada a uma estratégia de Chain-of-Thought (CoT), para aprimorar o desempenho de Modelos de Linguagem de Grande Porte (LLMs) na abordagem de questões médicas complexas. Ao integrar um mecanismo robusto de recuperação que busca evidências confiáveis em literatura médica consolidada e ao refinar a informação com rerranqueamento, nossa abordagem não só melhora a precisão das respostas, mas também demonstra que modelos maiores podem ser efetivamente destilados em variantes menores e mais eficientes em recursos, mantendo desempenho comparável. O pipeline é avaliado em cenários de perguntas e respostas zero-shot, empregando uma estratégia de recuperação baseada apenas na pergunta para simular contextos clínicos realistas, onde não há ajuste fino específico de domínio prévio. Este trabalho destaca o potencial da combinação de técnicas de recuperação com raciocínio sequencial para superar os desafios inerentes à IA médica, abrindo caminho para sistemas mais precisos, transparentes e acessíveis em aplicações de saúde. | pt_BR |
dc.subject.cnpq | Áreas::Ciências Exatas e da Terra::Ciência da Computação | pt_BR |
dc.degree.departament | ::(CIN-DCC) - Departamento de Ciência da Computação | pt_BR |
dc.degree.graduation | ::CIn-Curso de Ciência da Computação | pt_BR |
dc.degree.grantor | Universidade Federal de Pernambuco | pt_BR |
dc.degree.local | Recife | pt_BR |
dc.identifier.orcid | https://orcid.org/0009-0001-2157-8034 | pt_BR |
Aparece en las colecciones: | (TCC) - Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TCC Charles Gabriel Carvalho Cristovão.pdf | 660,29 kB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons