Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/64778
Compartilhe esta página
Título: | Estratégias para aprimorar técnicas supervisionadas de classificação para contextos semi-supervisionados |
Autor(es): | PÉREZ, José Luis Martínez |
Palavras-chave: | Inteligência computacional; Aprendizado semi- supervisionado; Detectores de mudanças de conceito; Autoaprendizado; Comitê de classificadores; Fluxo de dados |
Data do documento: | 25-Fev-2025 |
Editor: | Universidade Federal de Pernambuco |
Citação: | PÉREZ, José Luis Martínez. Estratégias para aprimorar técnicas supervisionadas de classificação para contextos semi-supervisionados. 2025.Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2025. |
Abstract: | Os algoritmos de aprendizado de máquina estão se tornando cruciais, e quando ex- postos a uma quantidade maior e mais relevante de dados de treinamento, tendem a apresentar melhor desempenho. No entanto, a disponibilidade de dados rotulados sem a intervenção de humanos é uma tarefa desafiadora, especialmente no aprendizado em fluxo de dados com mudanças de conceito, em que os dados são gerados rapidamente, em tempo real e com a possibilidade de alterações na distribuição de probabilidade. As mudanças de conceito ocorrem em ambientes de aprendizado supervisionado, semi-supervisionado e não supervisionado. Atualmente, o uso de mecanismos de detecção de mudanças em aprendizado semi-supervisionado é incomum, e a adição desses mecanismos aumenta o custo computacional. Além disso, a classificação em ambientes semi-supervisionados pode levar a problemas relacionados à rotulagem de dados para treinamento. Um erro nesse processo pode impactar negativamente o desempenho do modelo. Esta tese explora os seguintes pontos: 1) o uso de detectores de mudanças de conceito supervisionados em pro- blemas de aprendizado semi-supervisionado; 2) a influência da diversidade nos comitês de classificadores em cenários com mudanças de conceito; 3) introduz uma abordagem de self-training (auto-treinamento) para otimizar o aprendizado; e, por fim, 4) detalha as modificações realizadas no framework Massive Online Analysis (MOA) para a simulação de cenários semi-supervisionados. Os experimentos realizados utilizaram os classificadores Hoeffding Tree (HT) e Naïve Bayes (NB), individualmente ou como membros de comitê, sempre combinados com detectores e testados em 84 bases de dados artificiais e 11 reais. Os experimentos foram conduzidos com 15% e 30% de dados rotulados. Os resultados indicam que detectores desenvolvidos para aprendizado supervisionado podem ser utiliza- dos de forma eficaz em ambientes semi-supervisionados. Além disso, os testes com a nova abordagem de self-training demonstram que a inclusão de rótulos adicionais melhora sig- nificativamente o desempenho dos classificadores. Essas descobertas podem levar a uma mudança de paradigma em pesquisas futuras, uma vez que muitos pesquisadores não con- sideram os detectores de mudanças de conceito como uma alternativa viável devido à disponibilidade limitada de rótulos na maioria dos fluxos de dados do mundo real. |
URI: | https://repositorio.ufpe.br/handle/123456789/64778 |
Aparece nas coleções: | Teses de Doutorado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TESE José Luis Martínez Pérez.pdf | 2,13 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons