Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/65844

Compartilhe esta página

Título: Um estudo comparativo de ferramentas para perfilamento de dados em larga escala
Autor(es): MOTA, Luis Felipe Araujo
Palavras-chave: Big data; Perfilamento de dados; Qualidade de dados; Ferramentas de análise; Engenharia de dados; Avaliação da qualidade de dados
Data do documento: 31-Jul-2025
Citação: MOTA, Luis Felipe Araujo. Um estudo comparativo de ferramentas para perfilamento de dados em larga escala. 2025. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Universidade Federal de Pernambuco, Centro de Informática, Recife, 2025.
Abstract: O crescimento exponencial na geração de dados, impulsionado por sistemas digitais, sensores e plataformas em rede, tem transformado o cenário da engenharia de dados, especialmente com o advento do paradigma Big Data. Nesse contexto, a compreensão e a qualidade dos dados assumem papel estratégico para organizações que buscam decisões fundamentadas em evidências confiáveis. O data profiling, entendido como o processo sistemático de extração de metadados estatísticos e estruturais, emerge como etapa crítica para a inspeção, limpeza e integração de dados, sobretudo em ambientes caracterizados por grande volume e diversidade de formatos. No entanto, a aplicação prática do data profiling em cenários de Big Data ainda carece de estudos que combinem rigor técnico e análise funcional. Este trabalho apresenta um estudo funcional e comparativo de três ferramentas de data profiling com suporte a ambientes de dados em larga escala. A partir de critérios metodológicos de seleção e de um checklist funcional baseado em literatura especializada, as ferramentas são avaliadas quanto às suas funcionalidades e desempenho frente a conjuntos de dados públicos representativos. Os resultados obtidos permitem identificar as vantagens, limitações e melhores contextos de uso de cada solução, contribuindo para a escolha fundamentada de ferramentas de data profiling em projetos de engenharia de dados.
URI: https://repositorio.ufpe.br/handle/123456789/65844
Aparece nas coleções:(TCC) - Sistemas da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC Luis Felipe Araujo Mota.pdf1,72 MBAdobe PDFVisualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons