Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/50327
Comparte esta pagina
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | VASCONCELOS, Germano Crispim | - |
dc.contributor.author | SOUZA JÚNIOR, Hélio Gonçalves de | - |
dc.date.accessioned | 2023-05-18T14:14:03Z | - |
dc.date.available | 2023-05-18T14:14:03Z | - |
dc.date.issued | 2022-03-11 | - |
dc.identifier.citation | SOUZA JÚNIOR, Hélio Gonçalves de. Comparação de métodos de inferência dos rejeitados em modelos de Credit Scoring. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/50327 | - |
dc.description.abstract | Os modelos de Credit Scoring têm desempenhado por muitos anos um papel impor- tante na sociedade, contribuindo para a saúde financeira e a oferta de crédito no mercado, com benefícios para credores e tomadores de empréstimos em geral. No entanto, na prática, esses modelos são normalmente construídos numa amostra da população de créditos aprovados e não consideram os clientes que foram rejeitados, causando um viés amostral. A Inferência dos Rejeitados é uma abordagem para estimar como os requerentes de crédito rejeitados teriam se comportado se tivessem sido aprovados, incorporando essas informações na reconstrução do modelo de Credit Scoring. Esta dissertação investiga e compara os métodos considerados estado da arte para inferência dos rejeitados, com dados reais em problemas de larga escala de análise de crédito: Reclassificação, Augmentation, Cluster e Parcelamento. Além disso, pro- põe uma nova abordagem para inferência dos rejeitados com um algoritmo de Deep Learning usado em outras aplicações, o Deep Learning, o Deep Embedded Clustering (DEC), para extração de características dos dados originais. Os métodos são avaliados por diversas métricas de performance, tais como: área sobre a curva ROC, Teste Kolmogorov-Smirnov, F1 score, Acurácia, Diferença entre taxas de inadimplência. Também são empregados o teste não para- métrico de Kruskal-Wallis e o teste post-hoc de Nemenyi para análise da relevância estatística dos resultados. Os métodos são analisados em três conjuntos de dados oriundos de empresas do varejo e mercado financeiro, com diversos perfis de taxa de reprovação. É investigado o quanto a inclusão de parcela dos rejeitados pode impactar em ganhos de performance nos métodos avaliados. Os experimentos realizados evidenciaram que existe diferença significativa entre os métodos estudados e que o método DEC teve desempenho superior que os demais métodos para a maioria das métricas avaliadas. | pt_BR |
dc.language.iso | por | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Inteligência computacional | pt_BR |
dc.subject | Aprendizagem de máquina | pt_BR |
dc.title | Comparação de métodos de inferência dos rejeitados em modelos de Credit Scoring | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.advisor-co | CUNHA, Rodrigo Carneiro Leão Vieira da | - |
dc.contributor.authorLattes | http://lattes.cnpq.br/6346651643913441 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | mestrado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/5943634209341438 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | Credit Scoring models have played an important role in society for many years, contribut- ing to financial health and the supply of credit in the market, with benefits for creditors and borrowers in general. However, in practice, these models are usually built on a sample of the population of approved credits and do not consider the customers that were rejected, causing a sample bias. Reject Inference is an approach to estimate how rejected credit applicants would have behaved had they been approved, incorporating this information into the reconstruc- tion of the Credit Scoring model. This dissertation investigates and compares state-of-the-art methods for inference of rejects, with real data in large-scale problems of credit analysis: Re- classification, Augmentation, Cluster and Parcelation. In addition, it proposes a new approach for reject inference with a Deep Learning algorithm used in other applications, Deep Learning, Deep Embedded Clustering (DEC), to extract features from the original data. The methods are evaluated by several performance metrics, such as: AUC, KS, F1, Accuracy, DTI. The non-parametric Kruskal-Wallis test and the post-hoc Nemenyi test are also used to analyze the statistical relevance of the results. The methods are analyzed in three sets of data from retail and financial market companies, with different failure rate profiles. It is investigated how much the inclusion of rejects can impact on performance gains in the evaluated methods. The experiments carried out showed that there is a significant difference between the methods studied and that the DEC method performed better than the other methods for most of the evaluated metrics. | pt_BR |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/1317570604315281 | pt_BR |
Aparece en las colecciones: | Dissertações de Mestrado - Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Hélio Gonçalves de Souza Júnior.pdf | 1,06 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons