Otimização quimiométrica para ensaios metabonômicos baseados em espectroscopia de RMN : diagnóstico e estadiamento de câncer de próstata

OLIVEIRA, Marcio Felipe de

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/65543

Comparte esta pagina

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.advisor	SILVA, Ricardo Oliveira da	-
dc.contributor.author	OLIVEIRA, Marcio Felipe de	-
dc.date.accessioned	2025-08-28T12:55:03Z	-
dc.date.available	2025-08-28T12:55:03Z	-
dc.date.issued	2024-02-27	-
dc.identifier.citation	OLIVEIRA, Marcio Felipe de. Otimização quimiométrica para ensaios metabonômicos baseados em espectroscopia de RMN : diagnóstico e estadiamento de câncer de próstata. Tese (Doutorado em Química) - Universidade Federal de Pernambuco, Recife, 2024.	pt_BR
dc.identifier.uri	https://repositorio.ufpe.br/handle/123456789/65543	-
dc.description.abstract	Uma das dificuldades enfrentadas por estudos metabonômicos, usando dados espectrais de ressonância magnética nuclear (RMN) obtidos de biofluidos de humanos, é o pequeno número de amostras frente ao número de variáveis geradas. Em adição a isso, dados da área de saúde também podem ser desbalanceados, o que pode acarretar sobreajuste nos modelos quimiométricos gerados. Dessa forma, técnicas bastante empregadas na aprendizagem de máquina, como a seleção de variáveis, sobreamostragem e regularização podem ser utilizados para mitigar esses efeitos. No presente trabalho, para mitigar o problema de sobreajuste de dois conjuntos de dados metabonômicos baseados em RMN de 1 H já publicados, foram testados de forma exaustiva sete técnicas de seleção de variáveis, e cinco métodos de classificação após reamostragem, gerando 43 combinações possíveis. Além disso, para um conjunto de dados inédito, foi realizado o mesmo processo exaustivo, para descoberta de um formalismo quimiométrico capaz de discriminar 38 indivíduos com câncer de próstata (CaP) e 23 sem a doença. Além disso, dos 38 indivíduos com CaP, 27, que seguiram sendo acompanhados foram divididos em três novos estudos metabonômicos preliminares: (1) estadiamento, composto por quinze pacientes com o índice de Gleason ≤ 2 e doze pacientes com Gleason > 2; (2) risco de recorrência, composto por doze pacientes com categoria T patológica, pT, < pT3 e margem cirúrgica negativa e quinze pacientes com classificação ≥ pT3 ou margem cirúrgica positiva; e (3) treze pacientes com remissão do câncer após a prostatectomia e catorze com recidiva bioquímica. Após essa busca exaustiva, para o diagnóstico de CaP, o formalismo com melhor desempenho foi o GA-LDA, que obteve sensibilidade e especificidade e exatidão, na validação externa, de 92%, 83% e 88%, respectivamente. A etapa de estadiamento, o modelo SFM-ETC- DT obteve precisão, sensibilidade e especificidade iguais a 88,9%, 75% e 100%, respectivamente. Para o risco de recidiva bioquímica, a partir da classificação pT e da margem cirúrgica, o modelo SFM-ETC-kSVM possuiu, na etapa de validação, precisão de 77,8%, sensibilidade de 75% e especificidade de 80%. Para a recidiva bioquímica, o modelo SFM- ETC-LDA obteve as figuras de mérito precisão, sensibilidade e especificidade, 80%, 87,5% e 60%, respectivamente. Para os seis conjuntos de dados avaliados, os modelos de classificação com regularização e treinados após seleção de variáveis e sobreamostragem obtiveram desempenho superior na generalização das predições do conjunto de validação, demonstrando a capacidade dessas técnicas na redução do sobreajuste. Mostrando também que a escolha apropriada de processamento de dados pode gerar modelos robustos, mesmo em dados pequenos e com grande dimensionalidade. Além disso, a técnica metabolômica baseada em RMN de 1 H se mostra uma alternativa interessante na redução de problemas durante o diagnóstico de CaP, podendo ser utilizado como uma ferramenta não invasiva para o auxílio médico no acompanhamento da doença.	pt_BR
dc.language.iso	por	pt_BR
dc.publisher	Universidade Federal de Pernambuco	pt_BR
dc.rights	openAccess	pt_BR
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/	pt_BR
dc.subject	Metabolômica	pt_BR
dc.subject	Quimiometria	pt_BR
dc.subject	Neoplasia	pt_BR
dc.subject	Soro	pt_BR
dc.subject	Espectroscopia	pt_BR
dc.subject	Pré-processamento de dados	pt_BR
dc.title	Otimização quimiométrica para ensaios metabonômicos baseados em espectroscopia de RMN : diagnóstico e estadiamento de câncer de próstata	pt_BR
dc.type	doctoralThesis	pt_BR
dc.contributor.authorLattes	http://lattes.cnpq.br/9555918280848305	pt_BR
dc.publisher.initials	UFPE	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.degree.level	doutorado	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/6974730097895255	pt_BR
dc.publisher.program	Programa de Pos Graduacao em Quimica	pt_BR
dc.description.abstractx	One of the challenges faced by metabonomic studies, using nuclear magnetic resonance (NMR) spectral data obtained from human biofluids, is the small number of samples compared to the number of generated variables. In addition to this, health data can also be imbalanced, leading to overfitting in chemometric models. Therefore, widely used machine learning techniques, such as feature selection, oversampling, and regularization, can be employed to mitigate these effects. In this study, aiming to demonstrate the capability of these techniques to address overfitting issues in two previously published sets of metabonomic data based on 1 H NMR, seven feature selection techniques and five classification methods after resampling were exhaustively tested, resulting in 43 possible combinations. Furthermore, for a novel dataset, the same exhaustive process was carried out to discover a chemometric formalism capable of discriminating between 38 individuals with prostate cancer (PCa) and 23 without the disease. Additionally, out of the 38 individuals with PCa, 27 who continued to be monitored were divided into three new preliminary metabonomic studies: (1) staging, consisting of fifteen patients with Gleason score ≤ 2 and twelve patients with Gleason score > 2; (2) risk of recurrence, composed of twelve patients with pathological category T, pT, < pT3, and negative surgical margin, and fifteen patients with classification ≥ pT3 or positive surgical margin; and (3) thirteen patients in cancer remission after prostatectomy and fourteen with biochemical recurrence. After this exhaustive search, for PCa diagnosis, the formalism with the best performance was GA-LDA, achieving sensitivity, specificity, and accuracy of 92%, 83%, and 88%, respectively, in external validation. For staging, the SFM-ETC-DT model achieved precision, sensitivity, and specificity of 88.9%, 75%, and 100%, respectively. Regarding the risk of biochemical recurrence, based on pT classification and surgical margin, the SFM-ETC- kSVM model demonstrated precision of 77.8%, sensitivity of 75%, and specificity of 80% in the validation stage. For biochemical recurrence, the SFM-ETC-LDA model obtained precision, sensitivity, and specificity figures of merit at 80%, 87.5%, and 60%, respectively. For the six evaluated datasets, regularization-based classification models trained after feature selection and oversampling demonstrated superior performance in generalizing predictions to the validation set, highlighting the effectiveness of these techniques in reducing overfitting. This emphasizes that appropriate data processing choices can yield robust models even with small and high-dimensional datasets. Furthermore, the metabonomic technique based on 1 H NMR proves to be an interesting alternative in addressing issues during PCa diagnosis, serving as a non-invasive tool for medical support in disease monitoring.	pt_BR
Aparece en las colecciones:	Teses de Doutorado - Química

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
TESE Marcio Felipe de Oliveira.pdf		7.18 MB	Adobe PDF	Visualizar/Abrir

Este ítem está protegido por copyright original

Visualizar la licencia

Mostrar el registro sencillo del ítem Recomiende este ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons