Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/63851
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | FIDALGO, Robson do Nascimento | - |
dc.contributor.author | MONTEIRO, Enrique Laborão | - |
dc.date.accessioned | 2025-06-18T12:27:06Z | - |
dc.date.available | 2025-06-18T12:27:06Z | - |
dc.date.issued | 2025-04-08 | - |
dc.date.submitted | 2025-04-24 | - |
dc.identifier.citation | MONTEIRO, Enrique Laborão. Avaliando a performance entre Apache Iceberg e Apache Hive utilizando esquema estrela. 2025. Trabalho de Conclusão de Curso (Engenharia da Computação) - Universidade Federal de Pernambuco, Recife, 2025. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/63851 | - |
dc.description.abstract | Com a crescente necessidade de sistemas de processamento e armazenamento de dados eficientes e escaláveis, os Data Lakes (DL) tornaram-se uma das arquiteturas mais populares. Assim, desafios relacionados à sua organização, consistência e desempenho de consultas se tornaram tópicos relevantes. A introdução dos Data Lakehouses (DLHs) visa resolver esses problemas, trazendo uma mescla entre atributos de DL e Data Warehouse (DW). O Apache Iceberg é uma solução emergente que visa abordar esses problemas, oferecendo uma camada refinada de gerenciamento de metadados, com suporte a transações ACID e otimizações para a leitura de grandes conjuntos de dados. Por outro lado, tabelas Hive, uma tecnologia mais consolidada, ainda são amplamente utilizadas para estruturar dados tabulares em Data Lakes. O objetivo desta investigação é avaliar o desempenho de tabelas gerenciadas pelo Apache Iceberg e pelo Hive em um cenário analítico real utilizando o Star Schema Benchmark. Além disso, busca-se analisar o impacto da inserção de dados, verificando como a fragmentação de arquivos e sua otimização influenciam o desempenho de cada solução. A pesquisa também visa identificar as vantagens potenciais do Apache Iceberg em relação ao Apache Hive, contribuindo para a melhores decisões tecnológicas para ambientes de Big Data. | pt_BR |
dc.format.extent | 53p. | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | pt_BR |
dc.subject | Data Lakehouse | pt_BR |
dc.subject | Apache Iceberg | pt_BR |
dc.subject | Esquema Estrela | pt_BR |
dc.subject | Star Schema Benchmark | pt_BR |
dc.title | Avaliando a performance entre Apache Iceberg e Apache Hive utilizando esquema estrela | pt_BR |
dc.type | bachelorThesis | pt_BR |
dc.degree.level | Graduacao | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/6390018491925933 | pt_BR |
dc.description.abstractx | With the increasing demand for efficient and scalable data processing and storage, the Data Lake (DL) has become one of the most popular architectures. As such, problems with it's management, consistency and query performance have become relevant topics. The introduction of Data Lakehouses (DLHs) aims to solve these issues, bringing a mix of Data Lake and Data Warehouse (DW) features. Apache Iceberg is an emerging solution that seeks to fix these issues, providing a refined metadata management layer, with support for ACID transactions and optimizations for querying large datasets. On the other side, Hive tables, a more consolidated technology, are still widely used to structure tabular data in Data Lakes. The objective of this current thesis is to evaluate the analytical performance of tables managed by both Apache Iceberg and Hive in a real-world scenario using the Star Schema Benchmark. Additionally, it's investigated the impact of data insertions and how the fragmentation of the data files and it's optimization influences the performance of each tool. The research aims to identify potential advantages of using Apache Iceberg in relation to Hive, contributing to better informed technological decisions in big data applications. | pt_BR |
dc.subject.cnpq | Áreas::Ciências Exatas e da Terra | pt_BR |
dc.degree.departament | ::(CIN-DCC) - Departamento de Ciência da Computação | pt_BR |
dc.degree.graduation | ::CIn-Curso de Engenharia da Computação | pt_BR |
dc.degree.grantor | Universidade Federal de Pernambuco | pt_BR |
dc.degree.local | Recife | pt_BR |
Aparece nas coleções: | (TCC) - Engenharia da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TCC Enrique Laborão Monteiro.pdf | 1,46 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons