Estratégias para aprimorar técnicas supervisionadas de classificação para contextos semi-supervisionados

PÉREZ, José Luis Martínez

Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/64778

Share on

Title:	Estratégias para aprimorar técnicas supervisionadas de classificação para contextos semi-supervisionados
Authors:	PÉREZ, José Luis Martínez
Keywords:	Inteligência computacional; Aprendizado semi- supervisionado; Detectores de mudanças de conceito; Autoaprendizado; Comitê de classificadores; Fluxo de dados
Issue Date:	25-Feb-2025
Publisher:	Universidade Federal de Pernambuco
Citation:	PÉREZ, José Luis Martínez. Estratégias para aprimorar técnicas supervisionadas de classificação para contextos semi-supervisionados. 2025.Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2025.
Abstract:	Os algoritmos de aprendizado de máquina estão se tornando cruciais, e quando ex- postos a uma quantidade maior e mais relevante de dados de treinamento, tendem a apresentar melhor desempenho. No entanto, a disponibilidade de dados rotulados sem a intervenção de humanos é uma tarefa desafiadora, especialmente no aprendizado em fluxo de dados com mudanças de conceito, em que os dados são gerados rapidamente, em tempo real e com a possibilidade de alterações na distribuição de probabilidade. As mudanças de conceito ocorrem em ambientes de aprendizado supervisionado, semi-supervisionado e não supervisionado. Atualmente, o uso de mecanismos de detecção de mudanças em aprendizado semi-supervisionado é incomum, e a adição desses mecanismos aumenta o custo computacional. Além disso, a classificação em ambientes semi-supervisionados pode levar a problemas relacionados à rotulagem de dados para treinamento. Um erro nesse processo pode impactar negativamente o desempenho do modelo. Esta tese explora os seguintes pontos: 1) o uso de detectores de mudanças de conceito supervisionados em pro- blemas de aprendizado semi-supervisionado; 2) a influência da diversidade nos comitês de classificadores em cenários com mudanças de conceito; 3) introduz uma abordagem de self-training (auto-treinamento) para otimizar o aprendizado; e, por fim, 4) detalha as modificações realizadas no framework Massive Online Analysis (MOA) para a simulação de cenários semi-supervisionados. Os experimentos realizados utilizaram os classificadores Hoeffding Tree (HT) e Naïve Bayes (NB), individualmente ou como membros de comitê, sempre combinados com detectores e testados em 84 bases de dados artificiais e 11 reais. Os experimentos foram conduzidos com 15% e 30% de dados rotulados. Os resultados indicam que detectores desenvolvidos para aprendizado supervisionado podem ser utiliza- dos de forma eficaz em ambientes semi-supervisionados. Além disso, os testes com a nova abordagem de self-training demonstram que a inclusão de rótulos adicionais melhora sig- nificativamente o desempenho dos classificadores. Essas descobertas podem levar a uma mudança de paradigma em pesquisas futuras, uma vez que muitos pesquisadores não con- sideram os detectores de mudanças de conceito como uma alternativa viável devido à disponibilidade limitada de rótulos na maioria dos fluxos de dados do mundo real.
URI:	https://repositorio.ufpe.br/handle/123456789/64778
Appears in Collections:	Teses de Doutorado - Ciência da Computação

Files in This Item:

File	Description	Size	Format
TESE José Luis Martínez Pérez.pdf		2.13 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show full item record Recommend this item

This item is licensed under a Creative Commons License