Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/40912
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | FIDALGO, Robson do Nascimento | - |
dc.contributor.author | AZEVEDO, Alesanco Andrade | - |
dc.date.accessioned | 2021-08-10T13:44:25Z | - |
dc.date.available | 2021-08-10T13:44:25Z | - |
dc.date.issued | 2021-02-26 | - |
dc.identifier.citation | AZEVEDO, Alesanco Andrade. Data warehouse newSQL: uma análise de desempenho explorando estratégias de armazenamento e distribuição. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2021. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/40912 | - |
dc.description.abstract | Data Warehouses (DWs) são bancos de dados projetados para favorecer o processamento ana- lítico de grandes volumes de dados. Com o intuito de prover melhor desempenho de armazena- mento e processamento analítico em DWs, sistemas de bancos de dados NewSQL surgem como uma alternativa promissora. Essa classe de banco de dados oferece facilidades para suportar es- calabilidade horizontal, linguagem SQL e armazenamento principal em memória RAM. Existem estudos que analisam o desempenho de distribuições NewSQL em processamento transacional e analítico de dados, contudo, até onde sabemos, não há estudo que analise o impacto do uso de diferentes esquemas de dados, métodos de distribuição e formas de armazenamento no desempenho de um DW implementado em NewSQL. Dessa forma, usando diferentes volumes de dados, propomos uma análise de desempenho em DWs NewSQL comparando diferentes esquemas de dados (esquema estrela e tabela flat), formas de armazenamento (rowstore e columnstore) e métodos de distribuição (replicação e particionamento por round-robin ou por hash). Para alcançar esse objetivo, realizamos uma avaliação experimental de desempenho em DWs, utilizando o Star Schema Benchmark (SSB) e o Sistema Gerenciador de Banco de Dados (SGBD) MemSQL, em estrutura de cluster de 3 computadores. Para a avaliação experimental, utilizamos métricas de volume e desempenho de tempo em tarefas de carga e consultas de dados. A partir dos dados coletados, verificamos que o uso de tabelas flat, armazenamento columnstore e particionamento por chave hash gerou os melhores resultados no tempo médio de consultas, apresentando, contudo, desvantagens no tempo de carga e no volume de dados armazenado. Destacamos ainda que o uso de columnstore, realizado em disco, conseguiu obter melhores resultados em tarefas de consulta, quando comparado rowstore realizado em RAM, diante todos os cenários avaliados. | pt_BR |
dc.language.iso | por | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | embargoedAccess | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Banco de dados | pt_BR |
dc.subject | Data warehouse | pt_BR |
dc.subject | Desempenho | pt_BR |
dc.title | Data warehouse newSQL : uma análise de desempenho explorando estratégias de armazenamento e distribuição | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/7444646402261152 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | mestrado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/6390018491925933 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | Data Warehouses (DWs) are databases designed to favor the analytical processing of large volumes of data. In order to provide better storage performance and analytical processing in DWs, NewSQL database systems appear as a promising alternative. This class of database provides facilities to support scale-out, SQL language and main storage in RAM. There are studies that analyze the performance of NewSQL distributions in transactional and analytical data processing, however, as far as we know, there is no study that analyzes the impact of the use of different data schemes, distribution methods and forms of storage on the perfor- mance of a DW implemented in NewSQL. Thus, using different data volumes, we propose a performance analysis in NewSQL DWs comparing different data schemas (star schema and flat table), storage forms (rowstore and columnstore) and distribution methods (replication and partitioning by round-robin or hash). To achieve this goal, we performed an experimental performance evaluation on DWs, using the Star Schema Benchmark (SSB) and the MemSQL Database Manager System (SGBD), in a cluster structure of 3 computers. For the experi- mental evaluation, we used volume and time performance metrics in loading tasks and data queries. From the data collected, we verified that the use of flat tables, columnstore storage and hash key partitioning generated the best results in the average time of queries, presenting, however, disadvantages in the load time and in the volume of data stored. We also highlight that the use of columnstore, performed on disk, managed to obtain better results in query tasks, when compared to rowstore performed in RAM, given all the evaluated scenarios. | pt_BR |
Aparece nas coleções: | Dissertações de Mestrado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Alesanco Andrade Azevedo.pdf | 2,97 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons