Please use this identifier to cite or link to this item:
https://repositorio.ufpe.br/handle/123456789/64778
Share on
Title: | Estratégias para aprimorar técnicas supervisionadas de classificação para contextos semi-supervisionados |
Authors: | PÉREZ, José Luis Martínez |
Keywords: | Inteligência computacional; Aprendizado semi- supervisionado; Detectores de mudanças de conceito; Autoaprendizado; Comitê de classificadores; Fluxo de dados |
Issue Date: | 25-Feb-2025 |
Publisher: | Universidade Federal de Pernambuco |
Citation: | PÉREZ, José Luis Martínez. Estratégias para aprimorar técnicas supervisionadas de classificação para contextos semi-supervisionados. 2025.Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2025. |
Abstract: | Os algoritmos de aprendizado de máquina estão se tornando cruciais, e quando ex- postos a uma quantidade maior e mais relevante de dados de treinamento, tendem a apresentar melhor desempenho. No entanto, a disponibilidade de dados rotulados sem a intervenção de humanos é uma tarefa desafiadora, especialmente no aprendizado em fluxo de dados com mudanças de conceito, em que os dados são gerados rapidamente, em tempo real e com a possibilidade de alterações na distribuição de probabilidade. As mudanças de conceito ocorrem em ambientes de aprendizado supervisionado, semi-supervisionado e não supervisionado. Atualmente, o uso de mecanismos de detecção de mudanças em aprendizado semi-supervisionado é incomum, e a adição desses mecanismos aumenta o custo computacional. Além disso, a classificação em ambientes semi-supervisionados pode levar a problemas relacionados à rotulagem de dados para treinamento. Um erro nesse processo pode impactar negativamente o desempenho do modelo. Esta tese explora os seguintes pontos: 1) o uso de detectores de mudanças de conceito supervisionados em pro- blemas de aprendizado semi-supervisionado; 2) a influência da diversidade nos comitês de classificadores em cenários com mudanças de conceito; 3) introduz uma abordagem de self-training (auto-treinamento) para otimizar o aprendizado; e, por fim, 4) detalha as modificações realizadas no framework Massive Online Analysis (MOA) para a simulação de cenários semi-supervisionados. Os experimentos realizados utilizaram os classificadores Hoeffding Tree (HT) e Naïve Bayes (NB), individualmente ou como membros de comitê, sempre combinados com detectores e testados em 84 bases de dados artificiais e 11 reais. Os experimentos foram conduzidos com 15% e 30% de dados rotulados. Os resultados indicam que detectores desenvolvidos para aprendizado supervisionado podem ser utiliza- dos de forma eficaz em ambientes semi-supervisionados. Além disso, os testes com a nova abordagem de self-training demonstram que a inclusão de rótulos adicionais melhora sig- nificativamente o desempenho dos classificadores. Essas descobertas podem levar a uma mudança de paradigma em pesquisas futuras, uma vez que muitos pesquisadores não con- sideram os detectores de mudanças de conceito como uma alternativa viável devido à disponibilidade limitada de rótulos na maioria dos fluxos de dados do mundo real. |
URI: | https://repositorio.ufpe.br/handle/123456789/64778 |
Appears in Collections: | Teses de Doutorado - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TESE José Luis Martínez Pérez.pdf | 2,13 MB | Adobe PDF | ![]() View/Open |
This item is protected by original copyright |
This item is licensed under a Creative Commons License