Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/47025

Comparte esta pagina

Título : Desenvolvimento de base de dados e algoritmo de classificação antecipada de exames RT-qPCR para Covid-19
Autor : SOUSA, Karl Vandesman de Matos
Palabras clave : Inteligência computacional; Aprendizagem de máquina
Fecha de publicación : 2-jun-2022
Editorial : Universidade Federal de Pernambuco
Citación : SOUSA, Karl Vandesman de Matos. Desenvolvimento de base de dados e algoritmo de classificação antecipada de exames RT-qPCR para Covid-19. 2022. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2022.
Resumen : A doença denominada COVID-19, causada pelo vírus SARS-CoV-2 foi a responsável por gerar uma pandemia, preocupando diversos órgãos e instituições ao redor do mundo de forma a combatê-la e reduzir o seu impacto. Um dos fatores importantes para esse combate é o diagnóstico da doença, que deve considerar a assertividade e o tempo levado para sua conclu- são. Este trabalho atuou nos dados quantitativos gerados pelo exame RT-qPCR, obtidos pela disponibilização feita pelo Núcleo de Pesquisa em Inovação Terapêutica (NUPIT) da Univer- sidade Federal de Pernambuco. Os arquivos de saída do exame foram ajustados de forma a se ter uma base de dados disponível para treinamento de algoritmos de aprendizagem supervisio- nada, totalizando 75.716 linhas com 45 características temporais e um alvo classificado como positivo ou negativo. Esses dados formam uma série temporal, sendo cada característica um valor de fluorescência do processo da reação química do RT-qPCR, para detectar genes do SARS-CoV-2. Foram elencados diferentes algoritmos da literatura, desde mais genéricos a mais complexos, com comitês, e considerando ordenação temporal. Primeiramente, esses algoritmos foram treinados com a totalidade dos ciclos, para se ter uma referência do desempenho que poderia ser obtido. Posteriormente, foram realizados treinamentos com uma redução desse número de ciclos, com o intuito de antecipar o exame e consequentemente diminuir o tempo necessário para sua conclusão. Para comparar os desempenhos, foram analisadas as métricas AUROC (do inglês, Area Under the Receiver Operating Characteristic), acurácia, especifici- dade e sensibilidade, com média e desvio padrão calculadas em cima de cem reamostragens da base de dados. Para o cenário de redução de 30 ciclos, foi realizada a otimização de hiperparâ- metros dos três algoritmos que se destacaram na etapa anterior: um baseado em redes neurais, MLP (Multilayer Perceptron) e dois comitês de classificadores, o XGBoost e o Time Series Forest (TSF), sendo que este último considera a relação temporal das características. Testes estatísticos realizados indicaram um maior desempenho do TSF (AUROC 98, 98 ± 0, 07%) e do MLP (98, 94 ± 0, 19%) para 30 ciclos, uma melhoria de desempenho graças à otimização, mas ainda com desempenho inferior ao algoritmo treinado com 35 ciclos com valores padrões de hiperparâmetros. Com isso, este trabalho fornece respaldo para a redução do tempo do RT-qPCR aplicado para COVID-19, por meio de algoritmos de aprendizagem de máquina.
URI : https://repositorio.ufpe.br/handle/123456789/47025
Aparece en las colecciones: Dissertações de Mestrado - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
DISSERTAÇÃO Karl Vandesman de Matos Sousa.pdf3,89 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons