Propostas de métodos baseados em Co-op training para aprendizado semi-supervisionado em fluxos contínuos de dados

MONTEIRO, Paulo Martins

Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/49433

Share on

Title:	Propostas de métodos baseados em Co-op training para aprendizado semi-supervisionado em fluxos contínuos de dados
Authors:	MONTEIRO, Paulo Martins
Keywords:	Inteligência computacional; Fluxo contínuo de dados
Issue Date:	28-Oct-2022
Publisher:	Universidade Federal de Pernambuco
Citation:	MONTEIRO, Paulo Martins. Propostas de métodos baseados em Co-op training para aprendizado semi- supervisionado em fluxos contínuos de dados. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.
Abstract:	No contexto de fluxo contínuo de dados, no qual os dados são gerados em tempo real, é comum a existência de dados sem rótulos, por exemplo, devido ao alto custo para rotulá-los. Para lidar com estes dados, estão sendo propostas estratégias de aprendizagem semi-supervisionada em que são utilizados dados rotulados e não rotulados ao mesmo tempo. Outro desafio típico dos fluxos contínuos de dados é a presença das chamadas mudanças de conceito (concept drift): neste cenário, a distribuição de probabilidade dos dados muda com o tempo, o que causa uma diminuição da precisão das classificações. Essa dissertação apresenta três novos métodos baseados na técnica de nossa autoria o Co-op Training, nos quais são utilizados dois classificadores que cooperam entre si para realizar predições em fluxo contínuos de dados. Estes algoritmos foram adaptados com o objetivo de obter uma melhor acurácia de classificação quando comparados ao método original e aos seus concorrentes. O primeiro método proposto é o Co-op Training V2, uma versão menos rigorosa do método original; o segundo é o Co- op Training V3, que utiliza apenas o nível de confiança de ambos os classificadores para rotular dados sem rótulo; e o último é o Co-op Training V4, que também utiliza apenas o nível de confiança na rotulação de dados, tendo o treinamento de ambos os classificadores como principal diferença para o V3. Os métodos propostos foram comparados aos algoritmos disponíveis no MOA-SS, a extensão do Massive Online Analysis (MOA) framework que foi utilizada para realizar os testes. Os experimentos utilizaram bases de dados artificiais e reais, tanto em conjuntos de dados sem mudanças de conceito quanto em cenários com mudanças de conceito. Finalmente, analisamos quais algoritmos se saíram melhor em cada um dos cenários testados utilizando como métrica a acurácia e o teste pos-hoc Bonferroni-Dunn, tendo o Co-op Training como a melhor opção para ser utilizado sem detector de mudança de conceito.
URI:	https://repositorio.ufpe.br/handle/123456789/49433
Appears in Collections:	Dissertações de Mestrado - Ciência da Computação

Files in This Item:

File	Description	Size	Format
DISSERTAÇÃO Paulo Martins Monteiro.pdf		1.21 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show full item record Recommend this item

This item is licensed under a Creative Commons License