Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/64097

Compartilhe esta página

Título: Previsão de taxas de aprovação de escolas públicas com aprendizado de máquina : explorando os Valores de Shapley para aumentar a explicabilidade do modelo
Autor(es): ARRUDA, Danilo Cesar Vitorino de
Palavras-chave: Educação pública; Educação básica; Aprendizado de máquina; Valores de Shapley; Explicabilidade; Modelo de previsão
Data do documento: 29-Ago-2024
Editor: Universidade Federal de Pernambuco
Citação: ARRUDA, Danilo Cesar Vitorino de. Previsão de taxas de aprovação de escolas públicas com aprendizado de máquina: explorando os Valores de Shapley para aumentar a explicabilidade do modelo. 2024. Dissertação (Mestrado em Engenharia de Produção) – Universidade Federal de Pernambuco, Recife, 2024.
Abstract: A educação tem potencial de trazer benefícios para toda uma sociedade. Entretanto, a falha nesse campo pode representar efeitos bastante negativos. Pessoas mais escolarizadas tendem a desfrutar de maiores rendas e uma melhor saúde, enquanto o coletivo mais escolarizado está relacionado ao usufruto de comunidades mais seguras e com economia aquecida. Por outro lado, a desistência da escolarização pode trazer malefícios tanto para indivíduos quanto para grupos. Para evitar a concretização desse risco, este estudo explora os dados disponíveis, desenvolve e aplica um modelo de previsão para avaliar as taxas de aprovação nas escolas públicas brasileiras com o intuito de compreender a contribuição dos diversos fatores relacionados a estas instituições para os seus resultados educacionais. Para este último propósito, utiliza os Valores de Shapley para ponderar essas contribuições a partir da análise das coalizões possíveis dos aspectos característicos de sistemas educacionais. A biblioteca PyCaret foi explorada no processo de escolha do melhor modelo de Aprendizado de Máquina para o problema. Usando dados de 2015 a 2022, o modelo escolhido foi o CatBoost Regressor, que apresentou um coeficiente de determinação de 0,492 para os dados de treino e 0,467 para os dados de teste e foi utilizado para prever as taxas de aprovação escolar do ano de 2023. O método SHAP foi utilizado para interpretar o modelo e aumentar a sua explicabilidade, identificando os fatores-chave para os resultados de previsão obtidos, o que possibilita uma alocação mais eficiente dos recursos públicos. Os resultados mostram que escolas com altos índices de distorção idade-série apresentam grande influência negativa às taxas de aprovação. Diferentemente, a média de alunos por turma não tem uma análise trivial, pois menores números contribuem, majoritariamente, de forma positiva, mas há muitos pontos com influência negativa, indicando que deve haver uma diminuição nesse número de maneira cautelosa. A taxa de docentes com ensino superior apresentou um resultado nulo, quando são altas, mas negativo quando menores, assim como o fornecimento de internet. Foi observado, também, que a região geográfica exerceu uma influência considerável, com a região Sudeste se destacando positivamente e Norte negativamente. A localização da escola apresentou resultados contraintuitivos, com escolas urbanas contribuindo negativamente para o modelo, enquanto as escolas rurais contribuíram positivamente. Por fim, os resultados do trabalho foram discutidos em termos das suas implicações em sugestões para políticas públicas visando melhorar o indicador educacional em questão.
URI: https://repositorio.ufpe.br/handle/123456789/64097
Aparece nas coleções:Dissertações de Mestrado - Engenharia de Produção

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Danilo Cesar Vitorino de Arruda.pdf2,32 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons