Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/62662

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorFIDALGO, Robson do Nascimento-
dc.contributor.authorARAÚJO, Vinícius Marçal-
dc.date.accessioned2025-04-28T15:42:09Z-
dc.date.available2025-04-28T15:42:09Z-
dc.date.issued2025-02-27-
dc.date.submitted2025-02-27-
dc.identifier.citationARAÚJO, Vinícius Marçal. Uma revisão sistemática sobre retrieval-augmented generation (RAG) e modelos de linguagem de grande escala (LLMs) na construção de consultas SQL. 2025. Trabalho de Conclusão de Curso (Sistemas de Informação) - Universidade Federal de Pernambuco, Recife, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/62662-
dc.description.abstractOs Modelos de Linguagem de Grande Escala (LLMs) são modelos de inteligência artificial treinados em grandes quantidades de dados textuais, capazes de gerar respostas coerentes e realizar diversas tarefas de processamento de linguagem natural (PLN). A técnica de Retrieval-Augmented Generation (RAG) aprimora esses modelos ao incorporar fontes externas de conhecimento, permitindo que gerem respostas mais precisas e atualizadas. No contexto de bancos de dados, a conversão de linguagem natural para SQL (text-to-SQL) é um desafio, pois requer a interpretação correta da intenção do usuário e a geração de consultas eficientes. Este trabalho tem como objetivo realizar uma revisão sistemática da literatura para investigar as aplicações práticas de RAG e LLMs na construção de consultas SQL. A pesquisa busca identificar, organizar e analisar estudos existentes que explorem o uso desses modelos na criação e reestruturação de consultas, com o propósito de melhorar a eficiência de sistemas de banco de dados. A relevância do tema se destaca pela crescente necessidade de tornar a interação com bancos de dados mais acessível, permitindo que usuários sem conhecimento técnico possam realizar consultas complexas de forma intuitiva. Além disso, os avanços em inteligência artificial têm impulsionado a aplicação de modelos como RAG para otimizar processos de consulta e análise de dados. Por meio de uma revisão, busca-se mapear o estado da arte na área, destacando lacunas, avanços recentes e oportunidades para futuras pesquisas. A metodologia adotada segue o protocolo PRISMA, garantindo rigor na seleção, análise e síntese dos estudos incluídos. Foram utilizados critérios bem definidos para inclusão e exclusão de artigos, assegurando a confiabilidade dos achados. Os resultados indicam que as principais aplicações de RAG na construção de consultas SQL incluem assistentes de IA para consultas automatizadas, integração em chatbots corporativos, recuperação de informações em bases especializadas (como registros de saúde e propriedade intelectual) e otimização da geração de SQL em cenários complexos. Além disso, observam-se tendências promissoras, como o aprimoramento da precisão das consultas por meio da recuperação de contexto relevante e a redução do custo computacional para viabilizar o uso dessas técnicas em tempo real. Apesar do grande potencial, desafios técnicos ainda persistem, como a dificuldade na adaptação a cenários reais, a interpretação de consultas complexas e a necessidade de maior eficiência computacional.pt_BR
dc.format.extent43p.pt_BR
dc.language.isoporpt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectRetrieval-Augmented Generation (RAG)pt_BR
dc.subjectModelos de Linguagem de Grande Escala (LLMs)pt_BR
dc.subjectConsultas SQLpt_BR
dc.subjectBancos de Dadospt_BR
dc.subjectInteligência Artificialpt_BR
dc.subjectProcessamento de Linguagem Natural (PLN)pt_BR
dc.subjectRevisão Sistemática de Literaturapt_BR
dc.subjectEficiência em Sistemas de Informaçãopt_BR
dc.titleUma revisão sistemática sobre retrieval-augmented generation (RAG) e modelos de linguagem de grande escala (LLMs) na construção de consultas SQLpt_BR
dc.typebachelorThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/5444681174967990pt_BR
dc.degree.levelGraduacaopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6390018491925933pt_BR
dc.description.abstractxLarge Language Models (LLMs) are artificial intelligence models trained on vast amounts of textual data, capable of generating coherent responses and performing various natural language processing (NLP) tasks. The Retrieval-Augmented Generation (RAG) technique enhances these models by incorporating external knowledge sources, enabling them to generate more precise and up-to-date responses. In the context of databases, converting natural language into SQL queries (text-to-SQL) is a challenge, as it requires correctly interpreting the user's intent and generating efficient queries. This study aims to conduct a systematic literature review to investigate the practical applications of RAG and LLMs in constructing SQL queries. The research seeks to identify, organize, and analyze existing studies that explore the use of these models in creating and restructuring queries to improve database system efficiency. The relevance of this topic stands out due to the growing need to make database interaction more accessible, allowing users without technical knowledge to perform complex queries intuitively. Furthermore, advances in artificial intelligence have driven the application of models like RAG to optimize query processing and data analysis. Through a review, the study aims to map the state of the art in the field, highlighting gaps, recent advances, and opportunities for future research. The methodology follows the PRISMA protocol, ensuring rigor in the selection, analysis, and synthesis of the included studies. Well-defined criteria for article inclusion and exclusion were applied to ensure the reliability of the findings. The results indicate that the main applications of RAG in SQL query construction include AI assistants for automated queries, integration into corporate chatbots, information retrieval in specialized databases (such as health records and intellectual property data), and optimizing SQL generation in complex scenarios. Additionally, promising trends are observed, such as improving query accuracy through relevant context retrieval and reducing computational costs to enable real-time application of these techniques. Despite its great potential, technical challenges still persist, such as difficulty adapting to real-world scenarios, interpreting complex queries, and the need for greater computational efficiency.pt_BR
dc.subject.cnpqÁreas::Ciências Exatas e da Terrapt_BR
dc.degree.departament::(CIN-DIS) - Departamento de Informação e Sistemaspt_BR
dc.degree.graduation::CIn-Curso de Sistemas de Informaçãopt_BR
dc.degree.grantorUniversidade Federal de Pernambucopt_BR
dc.degree.localRecifept_BR
Aparece nas coleções:(TCC) - Sistemas da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC Vinícius Marçal Araújo.pdf.pdf1,04 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons