Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/33306

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorLÓSCIO, Bernadette Farias-
dc.contributor.authorSANTOS, Helton Douglas Araújo dos-
dc.date.accessioned2019-09-19T19:40:35Z-
dc.date.available2019-09-19T19:40:35Z-
dc.date.issued2018-08-22-
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/33306-
dc.description.abstractDesde o seu surgimento, a Web tem emergido como um importante canal de compartilhamento e troca de informações, habilitando a publicação e o consumo de conjuntos de dados de diferentes domínios. Na Web há uma participação ativa de atores que podem ser desde indivíduos até organizações públicas ou privadas, ou até mesmo sistemas ou dispositivos móveis. Esses atores podem agir tanto como publicadores quanto como consumidores de dados. O publicador produz, entrega e refina dados de algum tipo de acordo com condições específicas, enquanto que o consumidor, acessa e consome os dados, realizando análises, construindo visualizações, como também gerando novos dados. De maneira geral, dados na Web seguem um ciclo de vida composto de várias fases que vão desde a preparação dos dados até o refinamento. Em particular, o refinamento de conjuntos de dados diz respeito às atividades de limpeza e enriquecimento de dados, como também a atualizações e adição de novos dados a conjuntos de dados já existentes. Usualmente, o refinamento é realizado pelos publicadores de dados antes de efetuarem a publicação dos dados. Porém, consumidores de dados também realizam frequentemente a limpeza e o enriquecimento de conjuntos de dados ao processarem os mesmos nas suas atividades de consumo. É importante notar que o resultado do refinamento realizado pelos consumidores, na maioria das vezes, não é compartilhado nem com os publicadores do conjunto de dados original nem com outros consumidores interessados no mesmo conjunto de dados. Dessa forma, é muito comum que exista retrabalho, tanto por parte dos publicadores como por parte dos consumidores, uma vez que o resultado das atividades de refinamento não são compartilhadas. Nesse contexto, o objetivo deste trabalho é propor uma estratégia baseada nos princípios de open collaboration e social coding que permita o refinamento, de forma colaborativa, de conjuntos de dados publicados na Web, contribuindo, assim, para reduzir o retrabalho nas atividades de refinamento, bem como para melhorar a qualidade dos conjuntos de dados na Web.pt_BR
dc.description.sponsorshipCNPqpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectBanco de dadospt_BR
dc.subjectRefinamento de dadospt_BR
dc.titleUma estratégia para o refinamento colaborativo de dados na web baseada em social codingpt_BR
dc.typemasterThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/2541616516342112pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/2512064355660153pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxSince its inception, the Web has emerged as an important channel for sharing and exchanging information, enabling the publication and consumption of datasets from different domains. In this context, there is an active participation of multiple and autonomous actors who are involved in the publication and consumption of data on the Web. An actor can be an individual, a company, a system or a device who acts as a publisher or as a consumer. The publisher produces, delivers and refines data of some kind according to specific conditions. The consumer access and consumes data, performing analysis, building visualizations, as well as generating new data. In general, data on the Web follows a life cycle composed of several phases that ranges from data preparation to refinement. In particular, dataset refinement includes data cleansing and enrichment activities, as well as updates and adding new data to existing datasets. Typically, dataset refinement is performed by publishers before publishing the data. However, consumers also often clean and enrich datasets during the consuption actitivities. It is important to note that the refinement performed by consumers, most of the time, is not shared either with the publishers of the original dataset or with other consumers interested in the same dataset. In this way, it is very common that redoing the refinement over and over again, since the result of the refinement activities are not shared. In this context, the objective of this work is to propose a strategy based on the principles of open collaboration and social coding that allow the refinement of datasets published on the Web in a collaborative way, as consequence contributing to reduce rework in the refinement activities, as well as to improve the quality of datasets published on the Web.pt_BR
Aparece en las colecciones: Dissertações de Mestrado - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
DISSERTAÇÃO Helton Douglas Araújo dos Santos.pdf2,56 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons