Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/32659

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorGARCIA, Vinícius Cardoso-
dc.contributor.authorALENCAR, Andreza Leite de-
dc.date.accessioned2019-09-12T17:58:07Z-
dc.date.available2019-09-12T17:58:07Z-
dc.date.issued2018-09-06-
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/32659-
dc.description.abstractNa última década, surgiu uma nova tendência de abordagens que considera modelos não apenas como artefatos de documentação, mas também como artefatos centrais no campo da engenharia de software, permitindo a criação ou execução de sistemas de software complexos a partir desses modelos. Essas abordagens foram genericamente classificadas como Model-Driven Engineering (MDE). A análise de dados biológicos moleculares envolve a geração e interpretação de dados de genoma por sistemas de software complexos para apoiar decisões clínicas em diagnósticos. Esta análise pode ser decomposta em: (1) avaliação de qualidade dos dados brutos, (2) alinhamento de leitura a um genoma de referência, (3) identificação da variante, (4) anotação das variantes e visualização de dados. Por mais que existam diversas ferramentas para dar suporte a partes específicas deste processo, ele ainda enfrenta desafios. Um destes desafios está relacionado ao fato de não existirem padrões para publicação destes dados. Cada publicador escolhe qual conjunto de dados publicar e como publicá-lo. Como resultado, os serviços existentes, os formatos e os esquemas de dados podem variar significativamente. Diante deste cenário, identificou-se a demanda por pesquisas e soluções que possibilitem uma representação destes dados, auxiliando o processo de análise, especificamente na preparação de dados da etapa de anotação de variantes de genoma. Assim, esse trabalho busca responder a seguinte pergunta de pesquisa "Quais os conceitos e características do domínio de dados biológicos moleculares que precisam ser identificados e mapeados para prover uma representação deste conjunto de dados e possibilitar a geração de ferramentas que possibilitem o gerenciamento de seus esquemas de dados?". A abordagem de MDE surge como uma alternativa promissora neste cenário pois, com uso de recursos como meta-modelos e transformações de modelos, será possível contribuir com esta demanda. Assim, esse trabalho propõe uma solução que irá representar os esquemas de dados biológicos moleculares por meio de meta-modelos, permitindo o desenvolvimento de linguagens de modelagem e outros recursos que irão compor uma arquitetura de referência para dar suporte ao processo de anotação de variantes genéticas. A principais contribuições desse trabalho foram validadas por meio de suas implementações e avaliadas por meio de estudos baseados em opinião de especialistas e observação participante, que coletaram dados qualitativos e quantitativos sobre as contribuições. Entre as principais contribuições pode-se destacar: o meta-modelo GenDB; a linguagem de modelagem GenML; os algoritmos para identificação de esquemas e geração de esquemas de bases de dados orientadas a documento; e aplicação da abordagem deMDE para o desenvolvimento de soluções no contexto de engenharia de dados.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectEngenharia de softwarept_BR
dc.subjectMeta-modelopt_BR
dc.titleUm meta-modelo para representação de dados biológicos moleculares e suporte ao processo de anotação de variantes genéticaspt_BR
dc.typedoctoralThesispt_BR
dc.contributor.advisor-coBUREGIO, Vanilson Andre de Arruda-
dc.contributor.authorLatteshttp://lattes.cnpq.br/6060587704569605pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6613487636748832pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxIn the last decade, a new trend of approaches has emerged which considers models not only as documentation artifacts but also as central artifacts in the field of software engineering, allowing the creation or execution of complex software systems from these models. These approaches were generically classified as Model-Driven Engineering (MDE). The analysis of biomolecular data involves the generation and interpretation of genome data by complex software systems to support clinical decisions in diagnostics. This analysis can be broken down into: (1) raw data quality assessment, (2) reading alignment to a reference genome, (3) variant identification, (4) variant annotation and data visualization. Although there are several tools to support specific parts of this process, it still faces challenges. One of these challenges is related to the fact that there are no standards for publication of this data. Each publisher chooses which dataset to publish and how to publish it. As a result, existing services, formats, and data schemas can vary significantly. In this scenario, we identified the demand for research and solutions that allow a representation of these data, assisting the analysis process, specifically in the preparation of data from the annotation step. Thus, this theses seeks to answer the following research question "Which are the concepts and characteristics of the biomolecular data domain that need to be identified and mapped to provide a representation of this data set and enable the generation of tools that enable the management of your data schemas?". The MDE approach emerges as a promising alternative in this scenario because, with the use of resources such as meta-models and model transformations, it will be possible to contribute to this demand. Thus, this work proposes a solution that will represent the biomolecular data schemas by means of meta-models, allowing the development of modeling languages and other resources that will compose a reference architecture to support the genetic variants annotation process. The main contributions of this work were validated through their implementations and evaluated through expert opinion and participant observation studies, which collected qualitative and quantitative data on contributions. Among the main contributions, can be highlighted: the GenDB meta-model; the GenML modeling language; algorithms for schema identification and generation of document-oriented database schemas; and application of the MDE approach to the development of solutions in the context of data engineering.pt_BR
Aparece nas coleções:Dissertações de Mestrado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE Andreza Leite de Alencar.pdf8,8 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons