Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/63851

Compartilhe esta página

Título: Avaliando a performance entre Apache Iceberg e Apache Hive utilizando esquema estrela
Autor(es): MONTEIRO, Enrique Laborão
Palavras-chave: Data Lakehouse; Apache Iceberg; Esquema Estrela; Star Schema Benchmark
Data do documento: 8-Abr-2025
Citação: MONTEIRO, Enrique Laborão. Avaliando a performance entre Apache Iceberg e Apache Hive utilizando esquema estrela. 2025. Trabalho de Conclusão de Curso (Engenharia da Computação) - Universidade Federal de Pernambuco, Recife, 2025.
Abstract: Com a crescente necessidade de sistemas de processamento e armazenamento de dados eficientes e escaláveis, os Data Lakes (DL) tornaram-se uma das arquiteturas mais populares. Assim, desafios relacionados à sua organização, consistência e desempenho de consultas se tornaram tópicos relevantes. A introdução dos Data Lakehouses (DLHs) visa resolver esses problemas, trazendo uma mescla entre atributos de DL e Data Warehouse (DW). O Apache Iceberg é uma solução emergente que visa abordar esses problemas, oferecendo uma camada refinada de gerenciamento de metadados, com suporte a transações ACID e otimizações para a leitura de grandes conjuntos de dados. Por outro lado, tabelas Hive, uma tecnologia mais consolidada, ainda são amplamente utilizadas para estruturar dados tabulares em Data Lakes. O objetivo desta investigação é avaliar o desempenho de tabelas gerenciadas pelo Apache Iceberg e pelo Hive em um cenário analítico real utilizando o Star Schema Benchmark. Além disso, busca-se analisar o impacto da inserção de dados, verificando como a fragmentação de arquivos e sua otimização influenciam o desempenho de cada solução. A pesquisa também visa identificar as vantagens potenciais do Apache Iceberg em relação ao Apache Hive, contribuindo para a melhores decisões tecnológicas para ambientes de Big Data.
URI: https://repositorio.ufpe.br/handle/123456789/63851
Aparece nas coleções:(TCC) - Engenharia da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC Enrique Laborão Monteiro.pdf1,46 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons