Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/65543

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorSILVA, Ricardo Oliveira da-
dc.contributor.authorOLIVEIRA, Marcio Felipe de-
dc.date.accessioned2025-08-28T12:55:03Z-
dc.date.available2025-08-28T12:55:03Z-
dc.date.issued2024-02-27-
dc.identifier.citationOLIVEIRA, Marcio Felipe de. Otimização quimiométrica para ensaios metabonômicos baseados em espectroscopia de RMN : diagnóstico e estadiamento de câncer de próstata. Tese (Doutorado em Química) - Universidade Federal de Pernambuco, Recife, 2024.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/65543-
dc.description.abstractUma das dificuldades enfrentadas por estudos metabonômicos, usando dados espectrais de ressonância magnética nuclear (RMN) obtidos de biofluidos de humanos, é o pequeno número de amostras frente ao número de variáveis geradas. Em adição a isso, dados da área de saúde também podem ser desbalanceados, o que pode acarretar sobreajuste nos modelos quimiométricos gerados. Dessa forma, técnicas bastante empregadas na aprendizagem de máquina, como a seleção de variáveis, sobreamostragem e regularização podem ser utilizados para mitigar esses efeitos. No presente trabalho, para mitigar o problema de sobreajuste de dois conjuntos de dados metabonômicos baseados em RMN de 1 H já publicados, foram testados de forma exaustiva sete técnicas de seleção de variáveis, e cinco métodos de classificação após reamostragem, gerando 43 combinações possíveis. Além disso, para um conjunto de dados inédito, foi realizado o mesmo processo exaustivo, para descoberta de um formalismo quimiométrico capaz de discriminar 38 indivíduos com câncer de próstata (CaP) e 23 sem a doença. Além disso, dos 38 indivíduos com CaP, 27, que seguiram sendo acompanhados foram divididos em três novos estudos metabonômicos preliminares: (1) estadiamento, composto por quinze pacientes com o índice de Gleason ≤ 2 e doze pacientes com Gleason > 2; (2) risco de recorrência, composto por doze pacientes com categoria T patológica, pT, < pT3 e margem cirúrgica negativa e quinze pacientes com classificação ≥ pT3 ou margem cirúrgica positiva; e (3) treze pacientes com remissão do câncer após a prostatectomia e catorze com recidiva bioquímica. Após essa busca exaustiva, para o diagnóstico de CaP, o formalismo com melhor desempenho foi o GA-LDA, que obteve sensibilidade e especificidade e exatidão, na validação externa, de 92%, 83% e 88%, respectivamente. A etapa de estadiamento, o modelo SFM-ETC- DT obteve precisão, sensibilidade e especificidade iguais a 88,9%, 75% e 100%, respectivamente. Para o risco de recidiva bioquímica, a partir da classificação pT e da margem cirúrgica, o modelo SFM-ETC-kSVM possuiu, na etapa de validação, precisão de 77,8%, sensibilidade de 75% e especificidade de 80%. Para a recidiva bioquímica, o modelo SFM- ETC-LDA obteve as figuras de mérito precisão, sensibilidade e especificidade, 80%, 87,5% e 60%, respectivamente. Para os seis conjuntos de dados avaliados, os modelos de classificação com regularização e treinados após seleção de variáveis e sobreamostragem obtiveram desempenho superior na generalização das predições do conjunto de validação, demonstrando a capacidade dessas técnicas na redução do sobreajuste. Mostrando também que a escolha apropriada de processamento de dados pode gerar modelos robustos, mesmo em dados pequenos e com grande dimensionalidade. Além disso, a técnica metabolômica baseada em RMN de 1 H se mostra uma alternativa interessante na redução de problemas durante o diagnóstico de CaP, podendo ser utilizado como uma ferramenta não invasiva para o auxílio médico no acompanhamento da doença.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/pt_BR
dc.subjectMetabolômicapt_BR
dc.subjectQuimiometriapt_BR
dc.subjectNeoplasiapt_BR
dc.subjectSoropt_BR
dc.subjectEspectroscopiapt_BR
dc.subjectPré-processamento de dadospt_BR
dc.titleOtimização quimiométrica para ensaios metabonômicos baseados em espectroscopia de RMN : diagnóstico e estadiamento de câncer de próstatapt_BR
dc.typedoctoralThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/9555918280848305pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6974730097895255pt_BR
dc.publisher.programPrograma de Pos Graduacao em Quimicapt_BR
dc.description.abstractxOne of the challenges faced by metabonomic studies, using nuclear magnetic resonance (NMR) spectral data obtained from human biofluids, is the small number of samples compared to the number of generated variables. In addition to this, health data can also be imbalanced, leading to overfitting in chemometric models. Therefore, widely used machine learning techniques, such as feature selection, oversampling, and regularization, can be employed to mitigate these effects. In this study, aiming to demonstrate the capability of these techniques to address overfitting issues in two previously published sets of metabonomic data based on 1 H NMR, seven feature selection techniques and five classification methods after resampling were exhaustively tested, resulting in 43 possible combinations. Furthermore, for a novel dataset, the same exhaustive process was carried out to discover a chemometric formalism capable of discriminating between 38 individuals with prostate cancer (PCa) and 23 without the disease. Additionally, out of the 38 individuals with PCa, 27 who continued to be monitored were divided into three new preliminary metabonomic studies: (1) staging, consisting of fifteen patients with Gleason score ≤ 2 and twelve patients with Gleason score > 2; (2) risk of recurrence, composed of twelve patients with pathological category T, pT, < pT3, and negative surgical margin, and fifteen patients with classification ≥ pT3 or positive surgical margin; and (3) thirteen patients in cancer remission after prostatectomy and fourteen with biochemical recurrence. After this exhaustive search, for PCa diagnosis, the formalism with the best performance was GA-LDA, achieving sensitivity, specificity, and accuracy of 92%, 83%, and 88%, respectively, in external validation. For staging, the SFM-ETC-DT model achieved precision, sensitivity, and specificity of 88.9%, 75%, and 100%, respectively. Regarding the risk of biochemical recurrence, based on pT classification and surgical margin, the SFM-ETC- kSVM model demonstrated precision of 77.8%, sensitivity of 75%, and specificity of 80% in the validation stage. For biochemical recurrence, the SFM-ETC-LDA model obtained precision, sensitivity, and specificity figures of merit at 80%, 87.5%, and 60%, respectively. For the six evaluated datasets, regularization-based classification models trained after feature selection and oversampling demonstrated superior performance in generalizing predictions to the validation set, highlighting the effectiveness of these techniques in reducing overfitting. This emphasizes that appropriate data processing choices can yield robust models even with small and high-dimensional datasets. Furthermore, the metabonomic technique based on 1 H NMR proves to be an interesting alternative in addressing issues during PCa diagnosis, serving as a non-invasive tool for medical support in disease monitoring.pt_BR
Aparece nas coleções:Teses de Doutorado - Química

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE Marcio Felipe de Oliveira.pdf7,18 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons