Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/45450

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorPRUDÊNCIO, Ricardo Bastos Cavalcante-
dc.contributor.authorPARENTE, Regina Rosa-
dc.date.accessioned2022-08-04T13:44:50Z-
dc.date.available2022-08-04T13:44:50Z-
dc.date.issued2022-02-04-
dc.identifier.citationPARENTE, Regina Rosa. Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/45450-
dc.description.abstractA seleção de algoritmos é uma tarefa crucial e desafiadora no aprendizado de máquina em diferentes domínios do conhecimento. O meta-aprendizado trata a seleção de algoritmos como uma tarefa de aprendizado supervisionado. Exemplos de treinamento (ou seja, meta-exemplos) são gerados a partir de experimentos realizados com um conjunto de algoritmos candidatos em vários conjuntos de dados. Pode haver uma pequena disponibilidade de conjuntos de dados reais em alguns domínios, o que torna difícil gerar bons meta-exemplos. Portanto, confiar em conjuntos de dados sintéticos pode ser uma boa alternativa para gerar meta-exemplos. No entanto, não é garantido que todos os conjuntos de dados sintéticos sejam relevantes e representativos em comparação com os conjuntos de dados reais. Desta forma, o uso indiscriminado de muitos conjuntos de dados sintéticos aumenta o custo computacional da realização de experimentos sem melhorar significativamente a acurácia do meta-aprendizado. Nesta tese, lidamos com a seleção de conjuntos de dados sintéticos para meta-aprendizagem como um problema de classificação de uma classe (OCC). Em OCC, os classificadores são construídos assumindo a disponibilidade de exemplos de treinamento pertencentes a uma classe única de interesse (ou seja, a classe positiva), enquanto os rótulos de classe dos outros exemplos são desconhecidos. Na solução proposta, técnicas de OCC são utilizadas para selecionar os conjuntos de dados sintéticos mais relevantes (a classe desconhecida), considerando os conjuntos de dados reais (a classe positiva) disponíveis. Também conduzimos experimentos em dois estudos de caso, nos quais empregamos dois procedimentos diferentes de manipulação de dados para produzir conjuntos de dados sintéticos e duas técnicas de OCC para seleção de conjuntos de dados. Os resultados demonstraram que é possível usar um número reduzido de conjuntos de dados sintéticos selecionados, mantendo um bom desempenho do Meta-Aprendizado.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência Computacionalpt_BR
dc.subjectMeta-aprendizadopt_BR
dc.subjectSeleção de algoritmopt_BR
dc.subjectSeleção de conjuntos de dados sintéticospt_BR
dc.subjectClassificação de uma classept_BR
dc.titleClassificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizadopt_BR
dc.typedoctoralThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/9741127748330695pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/2984888073123287pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxAlgorithm selection is a crucial and challenging task in machine learning in different domains of knowledge. Meta-learning treats algorithm selection as a supervised learning task. Training examples (i.e. meta-examples) are generated from experiments performed with a set of candidate algorithms in several datasets. There may be a small availability of real datasets in some domains, which makes it challenging to generate good meta-examples. Therefore, relying on synthetic datasets may be a good alternative to generate meta-examples. However, it is not guaranteed that all synthetic datasets are relevant and representative compared to real datasets. In this way, the indiscriminate use of too many synthetic datasets increases the computational cost of performing experiments without significantly improving meta-learning accuracy. In this thesis, we deal with the selection of synthetic datasets for meta-learning as a one-class classification (OCC) problem. In OCC, classifiers are built by assuming the availability of training examples belonging to a unique class of interest (i.e., the positive class), while the class labels of the other examples are unknown. In the proposed solution, OCC techniques are used to select the most relevant synthetic datasets (the unknown class), by considering the real datasets (the positive class) available. We also conducted experiments in two case studies, in which we employed two different data manipulation procedures to produce synthetic datasets and two OCC techniques for dataset selection. The results demonstrated that it is possible to use a reduced number of selected synthetic datasets while maintaining a good meta-learning performance.pt_BR
Aparece nas coleções:Teses de Doutorado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE Regina Rosa Parente.pdf1,24 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons