Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/63851

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorFIDALGO, Robson do Nascimento-
dc.contributor.authorMONTEIRO, Enrique Laborão-
dc.date.accessioned2025-06-18T12:27:06Z-
dc.date.available2025-06-18T12:27:06Z-
dc.date.issued2025-04-08-
dc.date.submitted2025-04-24-
dc.identifier.citationMONTEIRO, Enrique Laborão. Avaliando a performance entre Apache Iceberg e Apache Hive utilizando esquema estrela. 2025. Trabalho de Conclusão de Curso (Engenharia da Computação) - Universidade Federal de Pernambuco, Recife, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/63851-
dc.description.abstractCom a crescente necessidade de sistemas de processamento e armazenamento de dados eficientes e escaláveis, os Data Lakes (DL) tornaram-se uma das arquiteturas mais populares. Assim, desafios relacionados à sua organização, consistência e desempenho de consultas se tornaram tópicos relevantes. A introdução dos Data Lakehouses (DLHs) visa resolver esses problemas, trazendo uma mescla entre atributos de DL e Data Warehouse (DW). O Apache Iceberg é uma solução emergente que visa abordar esses problemas, oferecendo uma camada refinada de gerenciamento de metadados, com suporte a transações ACID e otimizações para a leitura de grandes conjuntos de dados. Por outro lado, tabelas Hive, uma tecnologia mais consolidada, ainda são amplamente utilizadas para estruturar dados tabulares em Data Lakes. O objetivo desta investigação é avaliar o desempenho de tabelas gerenciadas pelo Apache Iceberg e pelo Hive em um cenário analítico real utilizando o Star Schema Benchmark. Além disso, busca-se analisar o impacto da inserção de dados, verificando como a fragmentação de arquivos e sua otimização influenciam o desempenho de cada solução. A pesquisa também visa identificar as vantagens potenciais do Apache Iceberg em relação ao Apache Hive, contribuindo para a melhores decisões tecnológicas para ambientes de Big Data.pt_BR
dc.format.extent53p.pt_BR
dc.language.isoporpt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/pt_BR
dc.subjectData Lakehousept_BR
dc.subjectApache Icebergpt_BR
dc.subjectEsquema Estrelapt_BR
dc.subjectStar Schema Benchmarkpt_BR
dc.titleAvaliando a performance entre Apache Iceberg e Apache Hive utilizando esquema estrelapt_BR
dc.typebachelorThesispt_BR
dc.degree.levelGraduacaopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6390018491925933pt_BR
dc.description.abstractxWith the increasing demand for efficient and scalable data processing and storage, the Data Lake (DL) has become one of the most popular architectures. As such, problems with it's management, consistency and query performance have become relevant topics. The introduction of Data Lakehouses (DLHs) aims to solve these issues, bringing a mix of Data Lake and Data Warehouse (DW) features. Apache Iceberg is an emerging solution that seeks to fix these issues, providing a refined metadata management layer, with support for ACID transactions and optimizations for querying large datasets. On the other side, Hive tables, a more consolidated technology, are still widely used to structure tabular data in Data Lakes. The objective of this current thesis is to evaluate the analytical performance of tables managed by both Apache Iceberg and Hive in a real-world scenario using the Star Schema Benchmark. Additionally, it's investigated the impact of data insertions and how the fragmentation of the data files and it's optimization influences the performance of each tool. The research aims to identify potential advantages of using Apache Iceberg in relation to Hive, contributing to better informed technological decisions in big data applications.pt_BR
dc.subject.cnpqÁreas::Ciências Exatas e da Terrapt_BR
dc.degree.departament::(CIN-DCC) - Departamento de Ciência da Computaçãopt_BR
dc.degree.graduation::CIn-Curso de Engenharia da Computaçãopt_BR
dc.degree.grantorUniversidade Federal de Pernambucopt_BR
dc.degree.localRecifept_BR
Aparece nas coleções:(TCC) - Engenharia da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC Enrique Laborão Monteiro.pdf1,46 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons