Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/66620

Share on

Title: Avaliação dos algoritmos de aprendizagem para predição da energia livre de gibbs de interações proteína-proteína
Authors: NASCIMENTO FILHO, Manassés Francisco do
Keywords: Aprendizado de Máquina; Super Learner; Interface de Interações; Proteína-Proteína; Energia Livre de Gibbs
Issue Date: 26-Jun-2025
Publisher: Universidade Federal de Pernambuco
Citation: NASCIMENTO FILHO, Manassés Francisco do. Avaliação dos algoritmos de aprendizagem para predição da energia livre de gibbs de interações proteína-proteína. 2025. Dissertação (Mestrado em Química) - Universidade Federal de Pernambuco, Recife, 2025.
Abstract: Neste trabalho, contribuiu-se com a avaliação sistemática dos modelos de regressão utilizados na construção de um metamodelo capaz de predizer a afinidade de ligação de complexos proteína-proteína, o qual apresentou correlação de Pearson (r) igual a 0,70. A predição da variação de energia livre de ligação (∆G) durante a formação desses complexos constitui um desafio na bioinformática estrutural, em virtude da complexidade dessas interações e da influência de diversos fatores físico-químicos. Tal predição é essencial para a compreensão de mecanismos biomoleculares, bem como para o desenvolvimento de fármacos e o projeto de terapias baseadas em proteínas, como anticorpos e vacinas. Os métodos computacionais tradicionais, como simulações baseadas em Dinâmica Molecular e Monte Carlo, embora altamente precisos, apresentam elevado custo computacional, o que limita sua aplicabilidade na triagem de grandes quantidades de proteínas. Como alternativa, métodos baseados em redes neurais, grafos e técnicas de Deep Learning, fundamentados em dados de sequência ou estrutura proteica, têm sido amplamente explorados e aprimorados. Diante desse cenário, avaliou-se o desempenho de dez algoritmos de regressão distintos, majoritariamente métodos de Machine Learning (ML), utilizados como base na arquitetura de um metamodelo de regressão com abordagem Super Learner (SL), cujo objetivo é predizer valores de ∆G a partir de descritores de interface calculados por meio do software Rosetta. Os modelos foram treinados com 526 estruturas no formato .pdb e seus respectivos valores experimentais de ∆G, considerando-se apenas dados de alta resolução (≤ 3,5 Å). Como melhor desempenho, obteve-se o modelo SL_MLP (Super Learner acoplado ao metamodelo Multilayer Perceptron), com r = 0,70, RMSE = 1,91 kcal/mol e R² = 0,48, com tempo de execução para o cálculo de energia inferior a cinco minutos em um computador de uso pessoal, equipado com 8 GB de memória RAM e processador Intel(R) Core(TM) i5-7300HQ (quatro núcleos, frequência base de 2,50 GHz, 6 MB de cache L3. O desempenho dos modelos foi comparado ao de ferramentas consolidadas com a mesma proposta, como Prodigy e Area Affinity, amplamente utilizadas para estimativas de ∆G com baixo custo computacional. Nesse teste, foi observado que, mesmo uma regressão linear simples aplicada aos descritores utilizados foi capaz de superar significativamente essas ferramentas. Além disso, os avanços obtidos neste trabalho contribuíram diretamente para a publicação do artigo "Estimating Absolute Protein–Protein Binding Free Energies by a Super Learner Model", na revista Journal of Chemical Information and Modeling, reconhecendo a relevância da abordagem proposta no contexto internacional da bioinformática estrutural. Os resultados obtidos reforçam o potencial dessa abordagem como ferramenta de triagem molecular, com baixo custo computacional e aplicabilidade prática. A avaliação realizada neste estudo contribui para o aprimoramento e a escolha criteriosa dos modelos que compõem o SL, visando sua aplicação em ambientes de triagem e análise de interação molecular
URI: https://repositorio.ufpe.br/handle/123456789/66620
Appears in Collections:Dissertações de Mestrado - Química

Files in This Item:
File Description SizeFormat 
DISSERTAÇÃO Manasses Francisco do Nascimento Filho.pdf4,77 MBAdobe PDFView/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons