Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/64778

Compartilhe esta página

Título: Estratégias para aprimorar técnicas supervisionadas de classificação para contextos semi-supervisionados
Autor(es): PÉREZ, José Luis Martínez
Palavras-chave: Inteligência computacional; Aprendizado semi- supervisionado; Detectores de mudanças de conceito; Autoaprendizado; Comitê de classificadores; Fluxo de dados
Data do documento: 25-Fev-2025
Editor: Universidade Federal de Pernambuco
Citação: PÉREZ, José Luis Martínez. Estratégias para aprimorar técnicas supervisionadas de classificação para contextos semi-supervisionados. 2025.Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2025.
Abstract: Os algoritmos de aprendizado de máquina estão se tornando cruciais, e quando ex- postos a uma quantidade maior e mais relevante de dados de treinamento, tendem a apresentar melhor desempenho. No entanto, a disponibilidade de dados rotulados sem a intervenção de humanos é uma tarefa desafiadora, especialmente no aprendizado em fluxo de dados com mudanças de conceito, em que os dados são gerados rapidamente, em tempo real e com a possibilidade de alterações na distribuição de probabilidade. As mudanças de conceito ocorrem em ambientes de aprendizado supervisionado, semi-supervisionado e não supervisionado. Atualmente, o uso de mecanismos de detecção de mudanças em aprendizado semi-supervisionado é incomum, e a adição desses mecanismos aumenta o custo computacional. Além disso, a classificação em ambientes semi-supervisionados pode levar a problemas relacionados à rotulagem de dados para treinamento. Um erro nesse processo pode impactar negativamente o desempenho do modelo. Esta tese explora os seguintes pontos: 1) o uso de detectores de mudanças de conceito supervisionados em pro- blemas de aprendizado semi-supervisionado; 2) a influência da diversidade nos comitês de classificadores em cenários com mudanças de conceito; 3) introduz uma abordagem de self-training (auto-treinamento) para otimizar o aprendizado; e, por fim, 4) detalha as modificações realizadas no framework Massive Online Analysis (MOA) para a simulação de cenários semi-supervisionados. Os experimentos realizados utilizaram os classificadores Hoeffding Tree (HT) e Naïve Bayes (NB), individualmente ou como membros de comitê, sempre combinados com detectores e testados em 84 bases de dados artificiais e 11 reais. Os experimentos foram conduzidos com 15% e 30% de dados rotulados. Os resultados indicam que detectores desenvolvidos para aprendizado supervisionado podem ser utiliza- dos de forma eficaz em ambientes semi-supervisionados. Além disso, os testes com a nova abordagem de self-training demonstram que a inclusão de rótulos adicionais melhora sig- nificativamente o desempenho dos classificadores. Essas descobertas podem levar a uma mudança de paradigma em pesquisas futuras, uma vez que muitos pesquisadores não con- sideram os detectores de mudanças de conceito como uma alternativa viável devido à disponibilidade limitada de rótulos na maioria dos fluxos de dados do mundo real.
URI: https://repositorio.ufpe.br/handle/123456789/64778
Aparece nas coleções:Teses de Doutorado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE José Luis Martínez Pérez.pdf2,13 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons