Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/47481

Share on

Title: Aplicação de machine learning para apostas esportivas: uso de regressão logística, SVM, árvore de decisão e Naive Bayes
Authors: LIMA, João Henrique Martins
Keywords: Apostas esportivas; Futebol; Machine learning; Previsão; Regressão logística
Issue Date: 20-Oct-2022
Citation: LIMA, João Henrique Martins. Aplicação de machine learning para apostas esportivas: uso de regressão logística, SVM, árvore de decisão e Naive Bayes. 2022. Trabalho de Conclusão de Curso (Ciências Atuariais) - Universidade Federal de Pernambuco, Recife, 2022.
Abstract: As práticas esportivas surgiram de atividades visando lazer e entretenimento, com o passar dos anos surgiu também um interesse econômico, e uma das ramificações é a aposta esportiva, cujo primeiro relato remonta aos Jogos Olímpicos da Antiguidade na época da Grécia antiga. Com o desenvolvimento da tecnologia e o advento da internet, as informações, os resultados, e o interesse pelo esporte e pelas apostas aumentaram, sendo possível fazer diferentes tipos de apostas em variados esportes. O futebol, por exemplo, influencia a vida de 3,5 bilhões de pessoas no mundo todo e é preferência nas apostas dos brasileiros. No Brasil entre 2018 e 2022 mesmo com a pandemia da Covid-19 o mercado local de apostas saiu de 2 bilhões de reais em movimentação para 7 bilhões, enquanto o mercado global foi avaliado no ano de 2020 em 59,6 bilhões de dólares, podendo chegar em 127,3 bilhões em 2027. O presente trabalho pretende gerar previsões dos resultados de jogos de futebol a partir de quatro métodos de machine learning e cinco ligas nacionais de futebol, com o objetivo de identificar qual a melhor combinação de método e liga que gera maior nível de assertividade nas previsões, além de verificar se com uma série de dados mais longa é possível obter uma melhoria na assertividade das previsões. Para tanto, desenvolvemos códigos, na linguagem de programação python, abordando quatro técnicas de machine learning: regressão logística, SVM, árvore de decisão e Naive Bayes. Utilizamos dados de cinco ligas nacionais de futebol: Brasil, Inglaterra, Itália, Espanha e França, com uma divisão dos dados para as 5 e as 10 últimas temporadas completas para efeito de comparação de resultados. Como resultado, foi possível observar que ao utilizar dados de 5 temporadas a melhor combinação foi aplicar regressão logística na Premier League e para 10 temporadas aplicar regressão logística ou SVM na Serie A, já que ambos tiveram mesmo desempenho. Quanto à comparação entre dados de 5 versus 10 temporadas houve ganhos em 3 das 5 ligas em relação às assertividades das previsões.
URI: https://repositorio.ufpe.br/handle/123456789/47481
Appears in Collections:(TCC) - Ciências Atuariais

Files in This Item:
File Description SizeFormat 
TCC João Henrique Martins Lima.pdf2,27 MBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons