Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/45961

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorOLIVEIRA, Adriano Lorena Inacio de-
dc.contributor.authorREYES, Dailys Maite Aliaga-
dc.date.accessioned2022-08-25T12:33:28Z-
dc.date.available2022-08-25T12:33:28Z-
dc.date.issued2022-02-23-
dc.identifier.citationREYES, Dailys Maite Aliaga. Predição para dados simbólicos multi-valorados de tipo quartis: caso especial dados representados por boxplots. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/45961-
dc.description.abstractUm dado simbólico de tipo boxplot pode ser considerado como um caso particular das variáveis numéricas multi-valoradas no contexto da Análises de Dados Simbólicos (ADS). Este tipo de dado tem uma estrutura simples que permite resumir informações de unidades agregadas, chamadas de classes. No entanto, esse tipo de estrutura tem sido pouco explorada na literatura de ADS. Este trabalho apresenta duas novas abordagens de predição com o objetivo de extrair conhecimento e fazer inferência usando dados de boxplot. A primeira abordagem considera um modelo de regressão para boxplot através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que permite melhorar a qualidade da variável resposta. Nessa direção, um critério é também proposto para verificar a coerência matemática da predição. Se a coerência não é garantida, uma nova estratégia, através de transformações Box − Cox é aplicada sobre a variável resposta de tipo boxplot. A segunda abordagem proposta nesse trabalho consiste de um modelo que combina agregação, seleção de protótipos e previsão de séries temporais. Inicialmente, as séries temporais são agregadas em classes de entidades e representadas por boxplots. Um processo de seleção de protótipos baseado na informação mútua é aplicado para mitigar ruídos no conjunto de dados. Por último, um modelo multivariado para previsão de boxplots é construído. Ambos modelos são avaliados com conjuntos de dados sintéticos e reais. Uma comparação entre as abordagens propostas e outros métodos de predição da literatura de ADS é também descrita. Os resultados obtidos reforçam que para os conjuntos de dados usados, o poder preditivo das abordagens propostas é superior aos métodos da literatura usados para comparar. Além disso, este trabalho apresenta uma aplicação do mundo real no Setor Elétrico Brasileiro para fazer predição da temperatura dos motores usando a abordagem de regressão paramétrica para dados de boxplot.pt_BR
dc.description.sponsorshipFACEPEpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsembargoedAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectSéries temporaispt_BR
dc.titlePredição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplotspt_BR
dc.typedoctoralThesispt_BR
dc.contributor.advisor-coSOUZA, Renata Maria Cardoso Rodrigues de-
dc.contributor.authorLatteshttp://lattes.cnpq.br/5549427916153795pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/5194381227316437pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxA symbolic boxplot data can be considered as a particular case of the numerical multivalued variables in the context of Simbolic Data Analysis (SDA). This data type has a simple structure that allows to summarize information from aggregated units, called classes. However, this type of structure has been little explored in the SDA literature. This work presents two new prediction approaches with the objective of extracting knowledge and making inferences using boxplot data. The first approach considers a regression model for boxplot through the parametric equation of the line. This parameterization allows the adjustment of the points in the regressors, which improves the quality of the response variable. In this direction, a criterion is also proposed to verify the mathematical coherence of the prediction. If coherence is not guaranteed, a new strategy, through Box-Cox transformations, is applied on the response variable of type boxplot. The second approach proposed in this work consists of a model that combines aggregation, prototype selection and time series prediction. Initially, time series are aggregated into entity classes and represented by boxplots. A prototype selection process based on mutual information is applied to mitigate noise in the dataset. Finally, a multivariate model for forecasting boxplots is built. Both models are evaluated with synthetic and real data sets. A comparison between the proposed approaches and other prediction methods from the SDA literature is also described. In addition, this work presents a real-world application in the Brazilian Electricity Sector to predict the temperature of motors using the parametric regression approach for boxplot data.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/9289080285504453pt_BR
Aparece nas coleções:Teses de Doutorado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE Dailys Maité Aliaga Reyes.pdf10,73 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons