Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/44559
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | OLIVEIRA, Adriano Lorena Inácio de | - |
dc.contributor.author | OLIVEIRA, Gustavo Henrique Ferreira de Miranda | - |
dc.date.accessioned | 2022-05-25T15:21:14Z | - |
dc.date.available | 2022-05-25T15:21:14Z | - |
dc.date.issued | 2022-02-24 | - |
dc.identifier.citation | OLIVEIRA, Gustavo Henrique Ferreira de Miranda. Tackling virtual and real concept drifts via adaptive gaussian mixture model approaches. 2022. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/44559 | - |
dc.description.abstract | As aplicações do mundo real têm lidado com uma grande quantidade de informações, que chegam de forma contínua e sequencialmente ao longo do tempo, caracterizadas como fluxos de dados. Esse tipo de dado desafia os algoritmos de aprendizado de máquina devido à mudança de conceito. A mudança de conceito é uma mudança na distribuição de probabilidade conjunta do problema e tem duas variações: a mudança virtual que afeta a distribuição de probabilidade incondicional p(x); e a mudança real que afeta a distribuição de probabilidade condicional p(y|x). Essas mudanças podem ocorrer separadamente e simultaneamente e ter impactos diferentes no desempenho do classificador. Os trabalhos da literatura geralmente não compreendem bem esses aspectos. Devido a isso, se concentram apenas nas mudanças reais, por que elas causam degradação direta no desempenho do classificador. No entanto, desvios virtuais também podem causar essa degradação de forma indireta. Novas observações podem chegar em uma região não treinada pelo classificador, forçando-o a confundir sua verdadeira classe, assim cometendo erros de classificação. O ideal seria ter classificadores que entendam que tipo de mudança ocorre em determinado momento para ativar estratégias apropriadas para lidar com este desafio. Este processo é chamado de entendimento da mudança. Como as abordagens da literatura não compreendem bem os diferentes impactos causados pelas mudanças virtuais e reais, o seu desempenho fica limitado. Motivados por isso, propomos três abordagens para entender o tipo da mudança e usar a estratégia correta para se adaptar, sendo elas: (i) Gaussian Mixture Model For Dealing With Virtual and Real Concept Drifts (GMM-VRD); (ii) On-line Gaussian Mixture Model With Noise Filter For Handling Virtual And Real Concept Drifts (OGMMF-VRD); e (iii) Gaussian Local Drift Detector for Drift Understanding (GLDD-DU). Essas abordagens atualizam e criam Gaussians on-line para lidar com mudanças virtuais, usam detectores de mudança para reinicializar o conhecimento do sistema para lidar com mudanças reais e recuperam modelos do pool para acelerar a adaptação a um novo conceito. Os principais resultados mostraram que todas as abordagens apresentam desempenho competitivo, mas o OGMMF-VRD foi mais consistente ao longo dos conjuntos de dados, apresentando melhor desempenho. | pt_BR |
dc.description.sponsorship | FACEPE | pt_BR |
dc.language.iso | eng | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Inteligência computacional | pt_BR |
dc.subject | Modelo de mistura gaussiana | pt_BR |
dc.subject | Fluxos de dados | pt_BR |
dc.subject | Mudança de conceito virtual | pt_BR |
dc.subject | Mudança de conceito real | pt_BR |
dc.title | Tackling virtual and real concept drifts via adaptive gaussian mixture model approaches | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.advisor-co | MINKU, Leandro Lei | - |
dc.contributor.authorLattes | http://lattes.cnpq.br/6122413580278340 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | doutorado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/5194381227316437 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | Real-world applications have been dealing with large amounts of data, which come continuously and sequentially over time, characterized as data streams. This type of data challenges machine learning algorithms due to concept drift. Concept drift is a change in the joint probability distribution of the problem and has two variations: virtual drift that affects the unconditional probability distribution p(x); and real drift that affects the conditional probability distribution p(y|x). These drifts can happen separately or simultaneously and can have different impacts on classifiers’ suitability. Existing work focuses mainly on real drifts, typically dealing with them by adopting mechanisms to react to performance degradation, which may result from such drifts. However, virtual drifts can also cause such performance degradation. Adopting mechanisms to deal with real drifts when the performance degradation occurs as a result of virtual drifts may not be ideal, hindering classifiers’ performances. Classifiers should ideally understand which type of drift occurs to activate appropriate strategies to deal with this challenge. This process is called drift understanding. Motivated by this, we propose three approaches to understand the drift type and use the correct strategy to adapt to it, namely: (i) GMM-VRD; (ii) OGMMF-VRD; and (iii) GLDD-DU. These approaches update and create Gaussians in an on-line manner to handle virtual drifts, use concept drift detection to reinitialize the system to handle real drifts, and retrieve models from a pool to speed up adaptation to a new concept. The main results show that these approaches are able to achieve competitive performance, but OGMMF-VRD was more consistent across different datasets. It thus performed better than the others. | pt_BR |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/9752509898747992 | pt_BR |
Aparece nas coleções: | Teses de Doutorado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TESE Gustavo Henrique Ferreira de Miranda Oliveira.pdf | 6,44 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons