Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/46166

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorMELO, Silvio de Barros-
dc.contributor.authorVICTOR, Sylvia Emmanuelle Castelo Branco de Holanda-
dc.date.accessioned2022-09-05T14:19:41Z-
dc.date.available2022-09-05T14:19:41Z-
dc.date.issued2022-03-08-
dc.identifier.citationVICTOR, Sylvia Emmanuelle Castelo Branco de Holanda. Notwarning e dynamicwarning: estratégias de aprendizado em fluxo de dados com base na análise dos efeitos do sinal de detecção warning. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/46166-
dc.description.abstractMuitos desafios de aplicações comerciais envolvem mineração de dados aplicado a classificação em fluxo de dados. Onde os classificadores são métodos incrementais de instâncias que aprendem com cada exemplo conforme chegam e são capazes de lidar com um fluxo teoricamente infinito, suscetível a mudanças de conceito, em um ambiente com severas restrições de tempo, processamento e quantidade de memória, além disso, também precisam ser capazes de predizer um padrão a qualquer momento. Exemplos de aplicações deste tipo, incluem: detecção de spam em e-mails, detecções de fraudes em cartões de crédito e detecção de logs de sistemas. Assim sendo, diferentes modelos de classificação foram adaptados para manipular fluxos de dados nessas condições, destacando-se para este trabalho a estratégia de aprendizado adaptativo aplicado a classificação com detecção, na qual a adaptação do modelo de aprendizado leva em consideração sinais de detecção do método de detecção de mudança de conceito. Normalmente, os trabalhos da literatura de detecção de mudança de conceito escolhem essa estratégia. Entretanto, é comum nas avaliações de desempenho, métodos detectores não fazerem distinção entre métodos que consideram dos que não consideram os sinais de detecção warning. Neste trabalho, os experimentos foram implementados no framework Massive Online Analysis (MOA) e executados na ferramenta MOAManager para analisar os impactos do sinal de detecção warning na acurácia dos novos modelos de decisão, e para isso são fornecidas evidências empíricas, referências e justificativas para descrever os efeitos do warning na acurácia. Deste modo, sendo possível concluir que os sinais de detecção warning melhoram a generalização dos modelos e na maioria das situações analisadas, quando são omitidos degradam a acurácia Prequential, resultando em diferenças estatísticas. Baseando-se nesses resultados, foram desenvolvidas duas estratégias para melhor lidar com os efeitos do sinal de detecção warning: o NotWarning e o DynamicWarning. Estas estratégias possuem mecanismos capazes de garantir que novos modelos sejam treinados antes de serem testados; construir conjuntos de treinamento para os novos modelos sem depender dos sinais de detecção warning do método de detecção de mudança de conceito; e uma gestão mais eficaz da criação de novos modelos. Além disso, é questionado o atual método de avaliação de detectores, que são baseados na acurácia da classificação, propondo uma nova metodologia de avaliação mais justa. Assim sendo, foi possível fornecer uma análise aprofundada comparando os impactos dos sinais de detecção warning na acurácia Prequential, incluindo um estudo empírico para comparar várias versões diferentes de métodos de detecção de mudança de conceito em cada estratégia. Por fim, os experimentos empíricos com bases artificiais alcançaram resultados promissores com os novos algoritmos.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectFluxo de dadospt_BR
dc.titleNotwarning e dynamicwarning : estratégias de aprendizado em fluxo de dados com base na análise dos efeitos do sinal de detecção warningpt_BR
dc.typedoctoralThesispt_BR
dc.contributor.advisor-coMACIEL, Bruno Iran Ferreira-
dc.contributor.authorLatteshttp://lattes.cnpq.br/6024522685346782pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3847692220708299pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxMuch commercial application’s challenges are related to data mining applied to data stream classification. The classifiers are instances’ incremental methods that learn from each example as they arrive and can handle a theoretically infinite data stream of instances. So, they used to be susceptible to concept drift, with severe restrictions in time processing and amount of memory. In addition, they also need to be able to predict a pattern at any time. Applications examples of this type include: spam detection in e-mails, credit cards fraud detection and logs system detection. Therefore, different classification models were adapted to manipulate data streams under these conditions,highlighting for this work the adaptive learning strategy applied to classification with detection, in which the learning model’s adaptation takes into account detection signals from the concept drift detection’s method. Usually, works in the concept drift detection literature choose this strategy. However, it is common in performance evaluations among detection methods not to distinguish between methods that consider detection warning signals’ from those that do not. In this work, the empirical experiments and the proposed algorithms were implemented in the framework Massive Online Analysis (MOA) and executed in the MOAManager tool to analyse the impacts of the warning detection signals’ on the new models’ accuracy were analyzed. For this, empirical evidence, references, and justifications are provided to describe the effects of warning on the accuracy. Thus, it is possible to conclude that warning detection signals’ in most analyzed situations, when they are omitted, cause impacts on the degradation of accuracy, resulting in statistical differences. Based on these results, two strategies were developed to better deal with the warning detection signals’ effects: the NotWarning and the DynamicWarning. They have mechanisms capable of guaranteeing that new models are trained before being tested without relying on the warning detection signals’ of the concept drift detection method. Then, it was possible to provide an in-depth analysis comparing the impacts of warning detection signals’ on Prequential accuracy, including an empirical study to compare several different versions of concept drift detection methods in each strategy. Finally, the empirical experiments in artificial datasets achieving good results in the new algorithms.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/7072484508087293pt_BR
Aparece nas coleções:Teses de Doutorado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE Sylvia Emmanuelle Castelo Branco de Holanda Victor.pdf1,34 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons