Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/65844

Share on

Title: Um estudo comparativo de ferramentas para perfilamento de dados em larga escala
Authors: MOTA, Luis Felipe Araujo
Keywords: Big data; Perfilamento de dados; Qualidade de dados; Ferramentas de análise; Engenharia de dados; Avaliação da qualidade de dados
Issue Date: 31-Jul-2025
Citation: MOTA, Luis Felipe Araujo. Um estudo comparativo de ferramentas para perfilamento de dados em larga escala. 2025. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Universidade Federal de Pernambuco, Centro de Informática, Recife, 2025.
Abstract: O crescimento exponencial na geração de dados, impulsionado por sistemas digitais, sensores e plataformas em rede, tem transformado o cenário da engenharia de dados, especialmente com o advento do paradigma Big Data. Nesse contexto, a compreensão e a qualidade dos dados assumem papel estratégico para organizações que buscam decisões fundamentadas em evidências confiáveis. O data profiling, entendido como o processo sistemático de extração de metadados estatísticos e estruturais, emerge como etapa crítica para a inspeção, limpeza e integração de dados, sobretudo em ambientes caracterizados por grande volume e diversidade de formatos. No entanto, a aplicação prática do data profiling em cenários de Big Data ainda carece de estudos que combinem rigor técnico e análise funcional. Este trabalho apresenta um estudo funcional e comparativo de três ferramentas de data profiling com suporte a ambientes de dados em larga escala. A partir de critérios metodológicos de seleção e de um checklist funcional baseado em literatura especializada, as ferramentas são avaliadas quanto às suas funcionalidades e desempenho frente a conjuntos de dados públicos representativos. Os resultados obtidos permitem identificar as vantagens, limitações e melhores contextos de uso de cada solução, contribuindo para a escolha fundamentada de ferramentas de data profiling em projetos de engenharia de dados.
URI: https://repositorio.ufpe.br/handle/123456789/65844
Appears in Collections:(TCC) - Sistemas da Computação

Files in This Item:
File Description SizeFormat 
TCC Luis Felipe Araujo Mota.pdf1,72 MBAdobe PDFView/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons