Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/62662
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | FIDALGO, Robson do Nascimento | - |
dc.contributor.author | ARAÚJO, Vinícius Marçal | - |
dc.date.accessioned | 2025-04-28T15:42:09Z | - |
dc.date.available | 2025-04-28T15:42:09Z | - |
dc.date.issued | 2025-02-27 | - |
dc.date.submitted | 2025-02-27 | - |
dc.identifier.citation | ARAÚJO, Vinícius Marçal. Uma revisão sistemática sobre retrieval-augmented generation (RAG) e modelos de linguagem de grande escala (LLMs) na construção de consultas SQL. 2025. Trabalho de Conclusão de Curso (Sistemas de Informação) - Universidade Federal de Pernambuco, Recife, 2025. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/62662 | - |
dc.description.abstract | Os Modelos de Linguagem de Grande Escala (LLMs) são modelos de inteligência artificial treinados em grandes quantidades de dados textuais, capazes de gerar respostas coerentes e realizar diversas tarefas de processamento de linguagem natural (PLN). A técnica de Retrieval-Augmented Generation (RAG) aprimora esses modelos ao incorporar fontes externas de conhecimento, permitindo que gerem respostas mais precisas e atualizadas. No contexto de bancos de dados, a conversão de linguagem natural para SQL (text-to-SQL) é um desafio, pois requer a interpretação correta da intenção do usuário e a geração de consultas eficientes. Este trabalho tem como objetivo realizar uma revisão sistemática da literatura para investigar as aplicações práticas de RAG e LLMs na construção de consultas SQL. A pesquisa busca identificar, organizar e analisar estudos existentes que explorem o uso desses modelos na criação e reestruturação de consultas, com o propósito de melhorar a eficiência de sistemas de banco de dados. A relevância do tema se destaca pela crescente necessidade de tornar a interação com bancos de dados mais acessível, permitindo que usuários sem conhecimento técnico possam realizar consultas complexas de forma intuitiva. Além disso, os avanços em inteligência artificial têm impulsionado a aplicação de modelos como RAG para otimizar processos de consulta e análise de dados. Por meio de uma revisão, busca-se mapear o estado da arte na área, destacando lacunas, avanços recentes e oportunidades para futuras pesquisas. A metodologia adotada segue o protocolo PRISMA, garantindo rigor na seleção, análise e síntese dos estudos incluídos. Foram utilizados critérios bem definidos para inclusão e exclusão de artigos, assegurando a confiabilidade dos achados. Os resultados indicam que as principais aplicações de RAG na construção de consultas SQL incluem assistentes de IA para consultas automatizadas, integração em chatbots corporativos, recuperação de informações em bases especializadas (como registros de saúde e propriedade intelectual) e otimização da geração de SQL em cenários complexos. Além disso, observam-se tendências promissoras, como o aprimoramento da precisão das consultas por meio da recuperação de contexto relevante e a redução do custo computacional para viabilizar o uso dessas técnicas em tempo real. Apesar do grande potencial, desafios técnicos ainda persistem, como a dificuldade na adaptação a cenários reais, a interpretação de consultas complexas e a necessidade de maior eficiência computacional. | pt_BR |
dc.format.extent | 43p. | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Retrieval-Augmented Generation (RAG) | pt_BR |
dc.subject | Modelos de Linguagem de Grande Escala (LLMs) | pt_BR |
dc.subject | Consultas SQL | pt_BR |
dc.subject | Bancos de Dados | pt_BR |
dc.subject | Inteligência Artificial | pt_BR |
dc.subject | Processamento de Linguagem Natural (PLN) | pt_BR |
dc.subject | Revisão Sistemática de Literatura | pt_BR |
dc.subject | Eficiência em Sistemas de Informação | pt_BR |
dc.title | Uma revisão sistemática sobre retrieval-augmented generation (RAG) e modelos de linguagem de grande escala (LLMs) na construção de consultas SQL | pt_BR |
dc.type | bachelorThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/5444681174967990 | pt_BR |
dc.degree.level | Graduacao | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/6390018491925933 | pt_BR |
dc.description.abstractx | Large Language Models (LLMs) are artificial intelligence models trained on vast amounts of textual data, capable of generating coherent responses and performing various natural language processing (NLP) tasks. The Retrieval-Augmented Generation (RAG) technique enhances these models by incorporating external knowledge sources, enabling them to generate more precise and up-to-date responses. In the context of databases, converting natural language into SQL queries (text-to-SQL) is a challenge, as it requires correctly interpreting the user's intent and generating efficient queries. This study aims to conduct a systematic literature review to investigate the practical applications of RAG and LLMs in constructing SQL queries. The research seeks to identify, organize, and analyze existing studies that explore the use of these models in creating and restructuring queries to improve database system efficiency. The relevance of this topic stands out due to the growing need to make database interaction more accessible, allowing users without technical knowledge to perform complex queries intuitively. Furthermore, advances in artificial intelligence have driven the application of models like RAG to optimize query processing and data analysis. Through a review, the study aims to map the state of the art in the field, highlighting gaps, recent advances, and opportunities for future research. The methodology follows the PRISMA protocol, ensuring rigor in the selection, analysis, and synthesis of the included studies. Well-defined criteria for article inclusion and exclusion were applied to ensure the reliability of the findings. The results indicate that the main applications of RAG in SQL query construction include AI assistants for automated queries, integration into corporate chatbots, information retrieval in specialized databases (such as health records and intellectual property data), and optimizing SQL generation in complex scenarios. Additionally, promising trends are observed, such as improving query accuracy through relevant context retrieval and reducing computational costs to enable real-time application of these techniques. Despite its great potential, technical challenges still persist, such as difficulty adapting to real-world scenarios, interpreting complex queries, and the need for greater computational efficiency. | pt_BR |
dc.subject.cnpq | Áreas::Ciências Exatas e da Terra | pt_BR |
dc.degree.departament | ::(CIN-DIS) - Departamento de Informação e Sistemas | pt_BR |
dc.degree.graduation | ::CIn-Curso de Sistemas de Informação | pt_BR |
dc.degree.grantor | Universidade Federal de Pernambuco | pt_BR |
dc.degree.local | Recife | pt_BR |
Aparece nas coleções: | (TCC) - Sistemas da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TCC Vinícius Marçal Araújo.pdf.pdf | 1,04 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons