Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/17640

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorSOUZA, Renata Maria Cardoso Rodrigues da-
dc.contributor.authorSOUZA, Leandro Carlos de-
dc.date.accessioned2016-08-08T12:52:58Z-
dc.date.available2016-08-08T12:52:58Z-
dc.date.issued2016-03-28-
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/17640-
dc.description.abstractUm intervalo é um tipo de dado complexo usado na agregação de informações ou na representação de dados imprecisos. Este trabalho apresenta duas novas representações para intervalos com o objetivo de se construir novos métodos de agrupamento e regressão linear para este tipo de dado. O agrupamento por nuvens dinâmicas define partições nos dados e associa protótipos a cada uma destas partições. Os protótipos resumem a informação das partições e são usados na minimização de um critério que depende de uma distância, responsável por quantificar a proximidade entre instâncias e protótipos. Neste sentido, propõe-se a formulação de uma nova distância híbrida entre intervalos baseando-se em distâncias para pontos. Os pontos utilizados são obtidos dos intervalos através de um mapeamento. Também são propostas duas versões com pesos para a distância criada: uma com pesos no hibridismo e outra com pesos adaptativos. Na regressão linear, propõe-se a representação dos intervalos através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que dão as melhores estimativas para os limites da variável resposta. Antes da realização da regressão, um critério é calculado para a verificação da coerência matemática da predição, na qual o limite superior deve ser maior ou igual ao inferior. Se o critério mostra que a coerência não é garantida, propõe-se a aplicação de uma transformação sobre a variável resposta. Assim, este trabalho também propõe algumas transformações que podem ser aplicadas a dados intervalares, no contexto de regressão. Dados sintéticos e reais são utilizados para comparar os métodos provenientes das representações propostas e aqueles presentes na literatura.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectAgrupamento por Nuvens Dinâmicaspt_BR
dc.subjectDistâncias Híbridas para Intervalospt_BR
dc.subjectRegressão Linear Intervalarpt_BR
dc.subjectMétodo dos Intervalos Parametrizadospt_BR
dc.subjectDynamic Clusteringpt_BR
dc.subjectInterval Hybrid Distancespt_BR
dc.subjectInterval Linear Regressionpt_BR
dc.subjectParametrized Interval Methodpt_BR
dc.titleAgrupamento e regressão linear de dados simbólicos intervalares baseados em novas representaçõespt_BR
dc.typedoctoralThesispt_BR
dc.contributor.advisor-coAMARAL, Getúlio José Amorim dopt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/7894153744845649pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxAn interval is a complex data type used in the information aggregation or in the representation of imprecise data. This work presents two new representations of intervals in order to construct a new cluster method and a new linear regression method for this kind of data. Dynamic clustering defines partitions into the data and it defines prototypes associated with each one of these partitions. The prototypes summarize the information about the partitions and they are used in a minimization criterion which depends on a distance, which is responsible for quantifying the proximity between instances and prototypes. In this way, it is proposed a new hybrid distance between intervals based on a family of distances between points. Points are obtained from the interval through a mapping. Also, it is proposed two versions of the hybrid distance, both with weights: one with weights in hybridism and other with adaptive weights. In linear regression, it is proposed to represent the intervals through the parametric equation of the line. This parametrization allows to find the set of points in the regression variables corresponding to the best estimates for the response variable limits. Before the regression construction, a criterion is computed to verify the mathematical consistency of prediction, where the upper limit must be greater than or equal to the lower. If the test shows that consistency is not guaranteed, then the application proposes a transformation of the response variable. Therefore, this work also proposes some transformations that can be applied to interval data in the regression context. Synthetic and real data are used to compare the proposed methods and those one proposed on literature.pt_BR
Aparece en las colecciones: Teses de Doutorado - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
teseCinLeandro.pdf1,29 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons