Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/40973

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorNASCIMENTO, Abraão David Costa do-
dc.contributor.authorSOUZA, Saul de Azevêdo-
dc.date.accessioned2021-08-16T17:52:05Z-
dc.date.available2021-08-16T17:52:05Z-
dc.date.issued2021-07-01-
dc.identifier.citationSOUZA, Saul de Azevêdo. Métodos estatísticos para dados em espaços não euclidianos. 2021. Tese (Doutorado em Estatística) – Universidade Federal de Pernambuco, Recife, 2021.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/40973-
dc.description.abstractEsta tese objetiva primeiramente estudar concentração em dados esféricos através de um novo paradigma, a saber, reduzir o problema na esfera real para o intervalo [0, 1]. Os dados esféricos endereçados são em duas frentes: fenômenos direcionais e axiais. Para alcançar o objetivo em questão, duas distribuições são propostas a partir de transformações baseadas em distâncias sobre as distribuições von Mises-Fisher (caso direcional) e Watson (caso axial) reais. As distribuições são denotadas como primeira transformação baseada em distância (TD₁(𝜅)) e segunda transformação baseada em distância (TD₂(𝜅)) para os casos direcional e axial, respectivamente, em que 𝜅 é um parâmetro que herda a relação com a concentração dos dados das distribuições esféricas. Algumas propriedades matemáticas para as distribuições TD₁ e TD₂ são discutidas: função geradora de momentos, momentos, curtose, assimetria e matriz de informação de Fisher. Além disso, discussões sobre inferência (pontual e teste de hipóteses) para os parâmetros dos novos modelos são realizadas. Uma vez propostas e estudadas as distribuições, elas são utilizadas como elementos centrais no desenvolvimento de estatísticas de testes para dados direcionais e axiais. Distribuições exatas para estas estatísticas são derivadas. Estudos numéricos, para as distribuições TD₁ e TD₂, apontam que as estimativas de máxima verossimilhança para 𝜅 apresentam bons desempenhos mesmo em pequenas amostras. Para o modelo 𝑇𝐷₁, verificam-se que: (i) os testes de hipóteses clássicos (escore, Wald e razão de verossimilhanças) são, em geral, conservadores quanto ao nível pré-especificado em altas concentrações; (ii) o teste escore foi o mais conservador; (iii) o teste Wald foi o mais liberal para pequenos valores de 𝜅. Para o modelo 𝑇𝐷₂, observam-se que: (i) o teste da razão de verossimilhanças tende a ser mais liberal para 𝜅 > 1; (ii) os testes Wald e escore são mais conservadores para 𝜅 > 0. Duas aplicações são feitas para ilustrar as propostas em dados esféricos. Resultados mostram que o uso dos paradigmas propostos conseguem detectar de modo simples (isto é, transferindo o problema de uma esfera real para o intervalo [0, 1]) e eficiente alta concentração em amostras esféricas. É sabido que a média é uma medida de locação influenciada por valores destoantes do conjunto tanto no contexto uni quanto multivariado em espaços Euclidianos. Esse problema também se verifica para variedades estocásticas, como o espaço das pré-formas ou a hiperesfera complexa. A segunda parte desta tese se dedica a proposta de uma alternativa robusta a média extrínseca de Fréchet, que tem fórmula analítica intratável. Fórmulas matemáticas para computar a mediana extrínseca projetada e procedimentos para detecção de outliers, baseados nessa medida, são apresentados. Estudos numéricos por simulação de Monte Carlo são realizados para quantificar a robustez da nova mediana em termos da distribuição Bingham complexa para o caso de formas planares. Os resultados mostraram que a mediana proposta é mais robusta que a forma média, principalmente para pequenos tamanhos de amostras. Uma aplicação aos dados de microfósseis ilustra o uso da mediana que propomos.pt_BR
dc.description.sponsorshipCAPESpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectEstatística Aplicadapt_BR
dc.subjectDados direcionaispt_BR
dc.subjectDados axiaispt_BR
dc.subjectDistância estocásticapt_BR
dc.titleMétodos estatísticos para dados em espaços não euclidianospt_BR
dc.typedoctoralThesispt_BR
dc.contributor.advisor-coAMARAL, Getúlio José Amorim do-
dc.contributor.authorLatteshttp://lattes.cnpq.br/4897563928589027pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9853084384672692pt_BR
dc.publisher.programPrograma de Pos Graduacao em Estatisticapt_BR
dc.description.abstractxFirstly, this thesis aims to study high phenomena concentration on real spherical data through a new paradigm, say to reduce the sphere problem to the interval [0, 1]. The spherical data are commonly addressed on two branchs: directional and axial phenomena. To achieve the paradigm we propose, two distributions are proposed in terms of distance-based transformations from the real von Mises-Fisher (directional case) and Wason (axial case) distributions. These new distributions are denoted as the first distance-based transformation (TD₁(𝜅)) and second distance-based transformation (TD₂(𝜅)) for projected directional and axial data, respectively, being 𝜅 a parameter that inherits the relationship with the concentration of data from spherical distributions. Some mathematical properties for the TD₁ and TD₂ distributions are discussed: moment generating function, moments, kurtosis and asymmetry and Fisher information matrix. In addition, essays about statistical inference (in the pontual and hypothesis test contexts) for the parameters for the new models are carried out. Once the distributions have been studied and proposed, they are used as core parts in the development of test statistics for directional and axial data. The exact distributions of these statistics are derived from the TD₁ and TD₂ laws. Numerical studies for both distributions show that the maximum likelihood estimates for 𝜅 achieve good performances, even in small samples. For the TD₁ model, it is found that: (i) the classic hypothesis tests (score, Wald and likelihood ratio) are generally conservatives with respect to the pre-specified nominal level in high concentration; (ii) the score tests is the most conservative; (iii) the Wald test is the most liberal for small values of 𝜅. For the TD₂ law, it is noticeable that: (i) the likelihood ratio test tends to be more liberal for 𝜅 > 1: (ii) the Wald and score tests are more conservatives for 𝜅 > 0. Two applications to real data are made to illustrate the proposals in spherical data. Results show that the use of the proposed paradigms is able to detect in a simple (transferring the problem of a real sphere to the interval [0, 1]) and efficient way high concentration in spherical samples. It is known that the mean is a location measure that is influenced by the different values of the set (say outliers), in both the uni and multivariate contexts of the Euclidean spaces. This problem also occurs for stochastic manifolds, such as the pre-shape space or the complex hypersphere. Second, this thesis also proposes an alternative to Fréchet extrinsic mean, which is analytically intractabel. Mathematical formulae to compute the projected extrinsic median are presented. Additionaly, a method for detecting outliers is introduced, based on the projected extrinsic median. Numerical studies by Monte Carlo experiments are performed to quantify the robustness of the median measure in terms of the complex Bingham distribution for plannar shapes.Results show that the proposed median is more robust than the mean shape, mainly for small sample sizes. Finally, an application to microfossil data is made to illustrate the proposed median.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/7674916684282039pt_BR
Aparece nas coleções:Teses de Doutorado - Estatística

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE Saul de Azevêdo Souza.pdf1,55 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons