Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/40462

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorADEODATO, Paulo Jorge Leitão-
dc.contributor.authorBRITO, Kellyton dos Santos-
dc.date.accessioned2021-07-08T19:46:43Z-
dc.date.available2021-07-08T19:46:43Z-
dc.date.issued2021-03-18-
dc.identifier.citationBRITO, Kellyton dos Santos. Machine learning for nowcasting elections in Latin America based on social media engagement and polls. 2021. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2021.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/40462-
dc.description.abstractContemporary social media (SM) represents a new communication paradigm and has impacted politics and electoral campaigns. The mobilization of the Arab Spring social movements was attributed to SM platforms, as well as successful electoral campaigns such as those of Obama and Trump in the U.S. (2008, 2012, and 2016), the Brexit campaign in 2016, and the Bolsonaro campaign for the Brazilian presidency in 2018. Within this new scenario, the advantages of collecting SM data over traditional polling methods include the huge volume of available data, the high speed, and low costs. Hence, researchers are endeavoring to discover how to use SM for nowcasting election results. However, despite the alleged success, the most-common approach, based on counting the volume of mentions on Twitter and conducting a sentiment analysis, has been frequently criticized and challenged. On the other hand, recent approaches based on other SM platforms and on the advances of machine learning (ML) may be promising alternatives. In this context, this thesis aims to advance the state-of-the-art on predicting elections based on SM data. It proposes a new set of SM performance metrics to be input features for the ML techniques by changing the focus onto the number of people paying attention to the candidates. The defined metrics may be used not only with the most commonly-used current SM platforms (i.e., Facebook, Instagram, and Twitter) but even with future platforms which have not yet gained popularity. In addition, this thesis defines SoMEN, the Social Media framework for Election Nowcasting, a framework composed of a process and model for nowcasting election results based on the SM performance features and using ML approaches. It proposes well-defined steps, ranging from election understanding to prediction evaluation, and an ML model for predicting the final election results based on an ensemble of artificial neural networks (ANN) trained with SM metrics as features and offline polls as labeled data. It also defines SoMEN-DC, an execution strategy for SoMEN that enables continuous prediction during the campaign (DC). The proposed metrics and framework were applied on the most recent main presidential elections in Latin America: Argentina (2019), Brazil (2018), Colombia (2018), and Mexico (2018). More than 65,000 posts were collected from the SM profiles on Facebook, Twitter, and Instagram of the candidates, as well as data from 195 presidential polls. Results demonstrated that the defined metrics presented a high correlation with the final share of votes in all the studied countries. Moreover, it was also possible to achieve a high level of accuracy in predicting the final vote share of the candidates, with competitive or better results than traditional polls. Lastly, despite the difficulty in measuring the quality of predictions during the campaign, results are promising and also competitive to polls. The strategies put forward in this thesis have attempted to handle several among the current challenges in this research area and indicate a new manner on how to face the problems. Furthermore, they may be directly used for nowcasting future elections in similar scenarios.pt_BR
dc.language.isoengpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência Computacionalpt_BR
dc.subjectRedes sociaispt_BR
dc.subjectEleiçõespt_BR
dc.subjectAprendizado de máquinaspt_BR
dc.titleMachine learning for nowcasting elections in Latin America based on social media engagement and pollspt_BR
dc.typedoctoralThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/8750956715158540pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3524590211304012pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxAs redes sociais contemporâneas representam um novo paradigma de comunicação e têm impactado a política e as campanhas eleitorais. A mobilização dos movimentos sociais da Primavera Árabe foi atribuída às redes sociais, assim como o sucesso de campanhas eleitorais como as de Obama e Trump nos Estados Unidos (2008, 2012 e 2016), o Brexit em 2016, e a campanha de Bolsonaro no Brasil em 2018. Neste novo cenário, as vantagens de coletar os dados das redes sociais sobre os métodos de pesquisa eleitoral tradicionais incluem a grande quantidade de dados disponíveis, a alta velocidade e baixo custo de coleta. Consequentemente, pesquisas estão sendo realizadas para usar as redes para prever os resultados eleitorais. Apesar do suposto sucesso da abordagem mais comum, baseada na contagem do volume de menções no Twitter combinada com análise de sentimento, esta tem sido frequentemente criticada e contestada. Por outro lado, novas abordagens baseadas em outras redes e nos avanços do aprendizado de máquina podem ser alternativas promissoras. Nesse contexto, esta tese objetiva avançar o estado da arte na previsão de eleições baseada em dados das redes sociais. Ela propõe um novo conjunto de métricas de desempenho nas redes, mudando o foco para o número de pessoas prestando atenção aos candidatos. As métricas definidas podem ser usadas tanto com as redes sociais mais populares atualmente (Facebook, Instagram e Twitter), quanto com plataformas futuras que ainda não ganharam popularidade. Esta tese também define o SoMEN (Social Media framework for Election Nowcasting), um framework composto por um processo e modelo para previsão das eleições baseado no desempenho nas redes sociais e usando abordagens de aprendizado de máquina. Ele propõe etapas bem definidas, que vão desde o entendimento da eleição até a avaliação das previsões, e um modelo para prever os resultados finais da eleição com base em um conjunto (ensemble) de redes neurais artificiais treinadas com as novas métricas de performance como variáveis e as pesquisas tradicionais como dados rotulados. Também definimos a SoMEN-DC, uma estratégia de execução para o SoMEN que permite a previsão contínua durante a campanha (DC). As métricas e o framework proposto foram aplicados nas principais eleições presidenciais mais recentes na América Latina: Argentina (2019), Brasil (2018), Colômbia (2018) e México (2018). Mais de 65.000 posts foram coletados dos perfis dos candidatos no Facebook, Twitter e Instagram, bem como dados de 195 pesquisas eleitorais. Os resultados demonstraram que as métricas definidas apresentaram alta correlação com o percentual de votos obtido pelos candidatos em todos os países estudados. Além disso, foi obtido um alto nível de precisão na previsão do percentual final de votos dos candidatos, com resultados competitivos ou melhores do que as pesquisas tradicionais. Por fim, apesar da dificuldade em medir a qualidade das previsões durante a campanha, os resultados são promissores e competitivos com as pesquisas. As estratégias propostas nesta tese levaram em consideração os principais desafios desta área de pesquisa e apresentam uma nova maneira de enfrentá-los. Além disso, elas podem ser usadas diretamente para prever eleições futuras em cenários semelhantes.pt_BR
Aparece en las colecciones: Teses de Doutorado - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TESE Kellyton dos Santos Brito.pdf3,28 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons