Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/32306

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorGARAY, Aldo William Medina-
dc.contributor.authorMARQUES, Alexandre Henrique Carvalho-
dc.date.accessioned2019-09-05T22:22:13Z-
dc.date.available2019-09-05T22:22:13Z-
dc.date.issued2018-07-27-
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/32306-
dc.description.abstractStatistical tools for modeling covariance structures have been shown useful in Medicine for studies in genetics. In that context, factor analysis models stand out for its ability in identifying latent factors capable of reducing data dimensionality and explaining observed variability. Usually, latent factors are interpreted as unobserved physiological mechanisms underlying the studied phenomenon. Confirmatory factor analysis models are characterized by allowing the researcher to pre-specify model’s elements, as for example, the number of latent factors, the loading matrix structure and linear restrictions on the parameters. Those models allow the validation of hypothesis in gene co-expression studies. Confirmatory factor analysis models under normality assumption for the data are well consolidated in the literature. Our aim is to develop a more general class capable of integrate several independent populations extending the data’s normality assumption to a more flexible class of distributions, the class of scale mixture of normal (SMN). The class of scale mixture of normal includes, as special cases, the normal distribution and distributions with heavy tails as the t-Student, contaminated normal ans slash. This model allows to specify parameter restrictions, which leads to important particular cases of covariance structures, making it more flexible in its specification and distributional assumptions. Model identifiability is studied, with necessary and/or sufficient conditions for parameter identification being presented. To estimate the model’s parameters we propose an ECM algorithm and the estimators’ performance in finite samples is evaluated through Monte Carlo simulation studies. We conclude the study with an illustration considering a confirmatory model for the pathological dynamic of pancreas cancer based on actual gene expression data.pt_BR
dc.description.sponsorshipCAPESpt_BR
dc.language.isoengpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectEstatísticapt_BR
dc.subjectAnálise fatorialpt_BR
dc.titleMultiple factor analysis model with scale mixture of normal distributions in the latent factorspt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coCYSNEIROS, Francisco José de Azevedo-
dc.contributor.authorLatteshttp://lattes.cnpq.br/3091837880986468pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6628260142102150pt_BR
dc.publisher.programPrograma de Pos Graduacao em Estatisticapt_BR
dc.description.abstractxFerramentas estatísticas voltadas para a modelagem de estruturas de covariâncias têm se mostrado úteis em medicina para estudos genéticos. Nesse contexto, modelos de análise fatorial destacam-se por sua habilidade em identificar fatores latentes capazes de reduzir a dimensionalidade dos dados e explicar a variabilidade observada. Comumente, fatores latentes são interpretados como mecanismos fisiológicos não observáveis subjacentes ao fenômeno estudado. Modelos de análise fatorial confirmatória caracterizam-se por possibilitar ao pesquisador a pré-especificação de elementos do modelo, como por exemplo, o número de fatores latentes, a estrutura da matriz de loadings e restrições lineares nos parâmetros. Tais modelos permitem a validação de hipotéses em estudos de coexpressão gênica. Modelos de análise fatorial confirmatório sob suposição de normalidade de dados estão bem consolidados na literatura. Nosso objetivo é desenvolver uma classe mais geral capaz de integrar várias populações independentes estendendo a suposição de normalidade de dados para uma classe mais flexível de distribuições, a classe de misturas de escala da distribuição normal (SMN). A classe SMN contém, como casos especiais, a distribuição normal e distribuições com caudas pesadas tais como t-Student, normal contaminada e slash. Este modelo permite especificar restrições nos parâmetros, as quais levam a importantes casos particulares de estruturas de covariância, tornando-o mais flexível em sua especificação e em suas suposições distribucionais. A identificabilidade do modelo é estudada e condições necessárias e/ou suficientes para identificação dos parâmetros são apresentadas. Para a estimação dos parâmetros do modelo propomos um algoritmo ECM e a performance dos estimadores em amostras finitas é avaliada através de estudos de simulação de Monte Carlo. Finalizamos nosso estudo com uma ilustração considerando o modelo confirmatório para a dinâmica patológica do câncer de pâncreas utilizando dados reais de expressão gênica.pt_BR
Aparece nas coleções:Dissertações de Mestrado - Estatística

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Alexandre Henrique Carvalho Marques.pdf852,83 kBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons