Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/1700
Título: Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
Autor(es): DOMINGUES, Marco Antonio de Oliveira
Palavras-chave: Análise de dados simbólicos;Modelo resistente de regressão linear simbólica;Detecção de outliers simbólicos intervalares
Data do documento: 31-Jan-2010
Editor: Universidade Federal de Pernambuco
Citação: Antonio de Oliveira Domingues, Marco; Maria Cardoso Rodrigues de Souza, Renata. Métodos robustos em regressão linear para dados simbólicos do tipo intervalo. 2010. Tese (Doutorado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010.
Resumo: A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas, listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais, análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo da regressão linear considerando apenas as informações sobre os pontos médios (centros) das variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos e considerando os valores dos pontos médios e das amplitudes dos intervalos. Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA, esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar a generalização de um conjunto de outras observações clássicas. Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados na literatura não estabelecem suposições probabilísticas. Além disso, considerando que a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de técnicas para a identificação de dados simbólicos intervalares atípicos
URI: https://repositorio.ufpe.br/handle/123456789/1700
Aparece na(s) coleção(ções):Teses de Doutorado - Ciência da Computação

Arquivos deste item:
Arquivo Descrição TamanhoFormato 
arquivo2961_1.pdf1,33 MBAdobe PDFVer/Abrir


Este arquivo é protegido por direitos autorais



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.