Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/47481

Compartilhe esta página

Título: Aplicação de machine learning para apostas esportivas: uso de regressão logística, SVM, árvore de decisão e Naive Bayes
Autor(es): LIMA, João Henrique Martins
Palavras-chave: Apostas esportivas; Futebol; Machine learning; Previsão; Regressão logística
Data do documento: 20-Out-2022
Citação: LIMA, João Henrique Martins. Aplicação de machine learning para apostas esportivas: uso de regressão logística, SVM, árvore de decisão e Naive Bayes. 2022. Trabalho de Conclusão de Curso (Ciências Atuariais) - Universidade Federal de Pernambuco, Recife, 2022.
Abstract: As práticas esportivas surgiram de atividades visando lazer e entretenimento, com o passar dos anos surgiu também um interesse econômico, e uma das ramificações é a aposta esportiva, cujo primeiro relato remonta aos Jogos Olímpicos da Antiguidade na época da Grécia antiga. Com o desenvolvimento da tecnologia e o advento da internet, as informações, os resultados, e o interesse pelo esporte e pelas apostas aumentaram, sendo possível fazer diferentes tipos de apostas em variados esportes. O futebol, por exemplo, influencia a vida de 3,5 bilhões de pessoas no mundo todo e é preferência nas apostas dos brasileiros. No Brasil entre 2018 e 2022 mesmo com a pandemia da Covid-19 o mercado local de apostas saiu de 2 bilhões de reais em movimentação para 7 bilhões, enquanto o mercado global foi avaliado no ano de 2020 em 59,6 bilhões de dólares, podendo chegar em 127,3 bilhões em 2027. O presente trabalho pretende gerar previsões dos resultados de jogos de futebol a partir de quatro métodos de machine learning e cinco ligas nacionais de futebol, com o objetivo de identificar qual a melhor combinação de método e liga que gera maior nível de assertividade nas previsões, além de verificar se com uma série de dados mais longa é possível obter uma melhoria na assertividade das previsões. Para tanto, desenvolvemos códigos, na linguagem de programação python, abordando quatro técnicas de machine learning: regressão logística, SVM, árvore de decisão e Naive Bayes. Utilizamos dados de cinco ligas nacionais de futebol: Brasil, Inglaterra, Itália, Espanha e França, com uma divisão dos dados para as 5 e as 10 últimas temporadas completas para efeito de comparação de resultados. Como resultado, foi possível observar que ao utilizar dados de 5 temporadas a melhor combinação foi aplicar regressão logística na Premier League e para 10 temporadas aplicar regressão logística ou SVM na Serie A, já que ambos tiveram mesmo desempenho. Quanto à comparação entre dados de 5 versus 10 temporadas houve ganhos em 3 das 5 ligas em relação às assertividades das previsões.
URI: https://repositorio.ufpe.br/handle/123456789/47481
Aparece nas coleções:(TCC) - Ciências Atuariais

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC João Henrique Martins Lima.pdf2,27 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons