Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/38596
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | ZANCHETTIN, Cleber | - |
dc.contributor.author | SILVA, Evandro José da Rocha e | - |
dc.date.accessioned | 2020-11-10T19:11:13Z | - |
dc.date.available | 2020-11-10T19:11:13Z | - |
dc.date.issued | 2019-09-06 | - |
dc.identifier.citation | SILVA, Evandro José da Rocha e. Geração dinâmica de protótipos para classificação em bases de dados com múltiplas classes desbalanceadas. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/38596 | - |
dc.description.abstract | Algoritmos de Aprendizado de Máquina comumente assumem que no conjunto de treinamento do modelo a quantidade de observações de cada classe é igual ou bastante similar. Entretanto, muitas bases de dados possuem classes com quantidades significativamente diferentes de instâncias. Foi observado na literatura que tais diferenças provocam uma queda no desempenho dos classificadores, a qual é associada ao enviesamento causado pela influência das classes que possuem mais instâncias. O efeito negativo no desempenho de classificadores é associado também à sobreposição de bordas, pequenos disjuntos, classes raras ou extremamente raras, e data set shift. Existem vários estudos considerando o desbalanceamento em bases de dados com duas classes, porém, estudos com múltiplas classes são menos frequentes, normalmente associados a sua maior complexidade. As soluções existentes normalmente englobam a decomposição do problema em combinações de versões binárias ou propostas ad hoc, ou seja, soluções específicas para o problema. Esta tese apresenta um estudo sobre a utilização de Geração de Protótipos no problema de múltiplas classes desbalanceadas. Duas abordagens foram propostas para tratar o problema, VDBC (Voronoi Diagram Based Classifier) e DCIA (Dynamic Centroid Insertion and Adjustment). A primeira consiste na geração de protótipos a partir da análise da vizinhança de cada instância na base de dados. A segunda aborda a geração mínima de protótipos, os quais podem ter seu posicionamento ajustado para refletir melhor as regiões de representação das classes. A partir das abordagens propostas, foram investigadas variações dos modelos, as quais foram comparadas entre si. Foi possível observar que o DCIA se destaca em relação ao VDBC. As suas melhores variações, cujos desempenhos são estatisticamente equivalentes, foram comparadas com várias soluções encontradas na literatura. Os resultados obtidos demostram a eficácia do DCIA ao ser competitivo e obter o melhor desempenho em várias das bases de dados utilizadas na validação das abordagens, principalmente nas bases que são consideradas mais desbalanceadas. | pt_BR |
dc.description.sponsorship | FACEPE | pt_BR |
dc.language.iso | por | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Inteligência Computacional | pt_BR |
dc.subject | Aprendizado de Máquina | pt_BR |
dc.subject | Bases Desbalanceadas | pt_BR |
dc.subject | Pré-processamento de Dados | pt_BR |
dc.title | Geração dinâmica de protótipos para classificação em bases de dados com múltiplas classes desbalanceadas | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/2704626940443054 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | doutorado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/1244195230407619 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | Machine Learning algorithms usually assume that in the model’s training data, the amount of observations for each class is equal or quite similar. However, several data sets have classes with significantly different number of instances. In the literature, it was observed that such differences induce classifiers to lose performance, which is associated with the bias caused by the influence of classes that have more instances. The negative effect on classifiers performance is also associated with border overlapping, small disjuncts, rare or extremely rare classes, and data set shift. There are several studies considering imbalance in data sets with two classes. However, studies with multiple classes are less frequent, usually associated with greater complexity. Existing solutions typically involve a problem decomposition into combinations of binary versions or ad hoc proposals, i.e., specific solutions for the problem. This thesis presents a study on the use of Prototype Generation with the problem of multiple imbalanced classes. Two approaches were proposed to deal with the problem, Voronoi Diagram Based Classifier (VDBC) and Dynamic Centroid Insertion and Adjustment (DCIA). The first one consists in the generation of prototypes from the neighborhood analysis of each instance in the data set. The second approach deals with a minimal prototype generation, which can have their positioning adjusted to better reflect the representation regions of classes. From the proposed approaches, variations of the models were investigated, which were compared with each other. It was possible to observe that DCIA stands out in relation to VDBC. DCIA’s best variations, whose performances are statistically equivalent, were compared with various solutions found in the literature. The obtained results demonstrate the effectiveness of DCIA by achieving the best performance on several of the used data sets, mainly in the data sets that are considered more imbalanced. | pt_BR |
Aparece nas coleções: | Teses de Doutorado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TESE Evandro José da Rocha e Silva.pdf | 4,67 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons