Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/46613

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorSILVA FILHO, Abel Guilhermino da-
dc.contributor.authorSILVA, Cecilia Cordeiro da-
dc.date.accessioned2022-09-21T16:40:02Z-
dc.date.available2022-09-21T16:40:02Z-
dc.date.issued2022-06-20-
dc.identifier.citationSILVA, Cecília Cordeiro da. Uma metodologia para construção de preditores de doenças baseada em aprendizado de máquina, computação bioinspirada e análise espaço-temporal. 2022. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/46613-
dc.description.abstractEm um mundo cada vez mais conectado por meio de vias físicas e virtuais, pessoas e dados circulam com cada vez mais facilidade. As mudanças demográficas e o intenso fluxo migratório das zonas rurais para as regiões urbanas geraram um crescimento desordenado das cidades. Isso combinado à ausência de boas condições de saneamento básico contribui para a proliferação do vetor. A emergência de surtos epidêmicos, como a dengue, a febre chikungunya, a zika e outras doenças tem contribuído para construir um cenário cada vez mais desafiador. A recente pandemia de Covid-19 trouxe grandes mudanças em escala mundial. Nesse cenário, cresceu fortemente o interesse por técnicas para predição espacial e temporal da distribuição de doenças a partir de tecnologias como a Internet das Coisas, aprendizado de máquina e múltiplas bases de dados. Este trabalho tem como objetivo geral propor uma metodologia para construção de preditores capazes de prever a distribuição espaço-temporal de doenças e apontar os fatores mais relevantes para a predição a partir de uma arquitetura baseada no acesso a múltiplas bases de dados. Para validação da proposta, foi adotada como estudo de caso a predição de casos de arboviroses por meio de séries históricas georreferenciadas de informações climáticas e ambientais utilizando técnicas de aprendizado de máquina. Essas informações são coletadas de múltiplos bancos de dados georreferenciados, previamente construídos a partir da coleta de informações por redes de sensores e do Sistema Único de Saúde. Foram utilizadas informações da Cidade do Recife, de casos de arboviroses (dengue, chikungunya e zika) de 2013 a 2016, e informações climáticas e ambientais do mesmo período, da APAC e do INMET. Os sistemas de predição de doenças construídos utilizando a metodologia proposta neste trabalho também devem ser capazes de apontar os fatores mais relevantes para a predição por meio do Comitê de Especialistas Artificiais, proposto neste trabalho e composto de um conjunto de algoritmos de seleção de atributos baseados em métodos de otimização por Computação Evolucionária. O Comitê de Especialistas Artificiais decide por votação. Os melhores resultados de predição de casos foram obtidos com regressão por Random Forest. Os valores do coeficiente de correlação de Pearson foram superiores a 0,99, enquanto o RMSE (%) se manteve inferior a 6%. Os índices de Kendall e Spearman também se mantiveram altos: seus valores foram superiores a 0,99 para Spearman e maiores que 0,90 para Kendall. O desempenho superior da Random Forest mostra que o problema de regressão é de difícil generalização, dado que a Random Forest é baseada em comitês de árvores de decisão e a regressão é realizada por uma média ponderada dos resultados das diferentes árvores de decisão que compõem o modelo.pt_BR
dc.description.sponsorshipCNPqpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectArbovirosespt_BR
dc.subjectEpidemiologia Digitalpt_BR
dc.subjectEndemiaspt_BR
dc.subjectPrediçãopt_BR
dc.subjectAprendizado de Máquinapt_BR
dc.subjectComputação Bioinspiradapt_BR
dc.titleUma metodologia para construção de preditores de doenças baseada em aprendizado de máquina, computação bioinspirada e análise espaço-temporalpt_BR
dc.typedoctoralThesispt_BR
dc.contributor.advisor-coSANTOS, Wellington Pinheiro dos-
dc.contributor.authorLatteshttp://lattes.cnpq.br/4162816449532098pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/8983932189780223pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxIn a world increasingly connected through physical and virtual pathways, people and data move more and more easily. Demographic changes and the intense migratory flow from rural areas to urban regions have generated disorderly growth in cities. This fact, combined with the absence of good basic sanitation conditions, contributes to the proliferation of disease vectors. The emergence of epidemic outbreaks such as dengue, chikungunya fever, zika and other diseases has contributed to building an increasingly challenging scenario. The recent Covid-19 pandemic has brought about major changes on a world scale. In this scenario, the interest in techniques for spatial and temporal pre- diction of disease distribution using technologies such as the Internet of Things, machine learning and multiple databases has grown strongly. The general objective of this work is to propose a methodology for building predictors capable of predicting the spatio-temporal distribution of diseases and pointing out the most relevant factors for prediction based on an architecture based on access to multiple databases. To validate the proposal, the prediction of arboviruses cases through georeferenced historical series of climatic and en- vironmental information using machine learning techniques was adopted as a case study. This information is collected from multiple georeferenced databases, previously built from the collection of information by sensor networks and the Unified Health System. We used information from the City of Recife, from cases of arboviruses (dengue, chikungunya and zika) from 2013 to 2016; and climate and environmental information from the same pe- riod, from APAC and INMET. Disease prediction systems built using the methodology proposed in this work should also be able to point out the most relevant factors for pre- diction through the Artificial Experts Committee, proposed in this work and composed of a set of feature selection algorithms based on Evolutionary Computation optimization methods. The Artificial Experts Committee decides by vote. The best case prediction re- sults were obtained with Random Forest regression. Pearson’s correlation coefficient values were above 0.99, while the RMSE (%) remained below 6%. The Kendall and Spearman indices also remained high: their values were above 0.99 for Spearman and above 0.90 for Kendall. The superior performance of Random Forest shows that the regression problem is difficult to generalize, given that Random Forest is based on decision tree committees and the regression is performed by a weighted average of the results of the different decision trees that make up the model.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/6413917211782026pt_BR
Aparece nas coleções:Teses de Doutorado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE Cecilia Cordeiro da Silva.pdf16,8 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons