Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/65543
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | SILVA, Ricardo Oliveira da | - |
dc.contributor.author | OLIVEIRA, Marcio Felipe de | - |
dc.date.accessioned | 2025-08-28T12:55:03Z | - |
dc.date.available | 2025-08-28T12:55:03Z | - |
dc.date.issued | 2024-02-27 | - |
dc.identifier.citation | OLIVEIRA, Marcio Felipe de. Otimização quimiométrica para ensaios metabonômicos baseados em espectroscopia de RMN : diagnóstico e estadiamento de câncer de próstata. Tese (Doutorado em Química) - Universidade Federal de Pernambuco, Recife, 2024. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/65543 | - |
dc.description.abstract | Uma das dificuldades enfrentadas por estudos metabonômicos, usando dados espectrais de ressonância magnética nuclear (RMN) obtidos de biofluidos de humanos, é o pequeno número de amostras frente ao número de variáveis geradas. Em adição a isso, dados da área de saúde também podem ser desbalanceados, o que pode acarretar sobreajuste nos modelos quimiométricos gerados. Dessa forma, técnicas bastante empregadas na aprendizagem de máquina, como a seleção de variáveis, sobreamostragem e regularização podem ser utilizados para mitigar esses efeitos. No presente trabalho, para mitigar o problema de sobreajuste de dois conjuntos de dados metabonômicos baseados em RMN de 1 H já publicados, foram testados de forma exaustiva sete técnicas de seleção de variáveis, e cinco métodos de classificação após reamostragem, gerando 43 combinações possíveis. Além disso, para um conjunto de dados inédito, foi realizado o mesmo processo exaustivo, para descoberta de um formalismo quimiométrico capaz de discriminar 38 indivíduos com câncer de próstata (CaP) e 23 sem a doença. Além disso, dos 38 indivíduos com CaP, 27, que seguiram sendo acompanhados foram divididos em três novos estudos metabonômicos preliminares: (1) estadiamento, composto por quinze pacientes com o índice de Gleason ≤ 2 e doze pacientes com Gleason > 2; (2) risco de recorrência, composto por doze pacientes com categoria T patológica, pT, < pT3 e margem cirúrgica negativa e quinze pacientes com classificação ≥ pT3 ou margem cirúrgica positiva; e (3) treze pacientes com remissão do câncer após a prostatectomia e catorze com recidiva bioquímica. Após essa busca exaustiva, para o diagnóstico de CaP, o formalismo com melhor desempenho foi o GA-LDA, que obteve sensibilidade e especificidade e exatidão, na validação externa, de 92%, 83% e 88%, respectivamente. A etapa de estadiamento, o modelo SFM-ETC- DT obteve precisão, sensibilidade e especificidade iguais a 88,9%, 75% e 100%, respectivamente. Para o risco de recidiva bioquímica, a partir da classificação pT e da margem cirúrgica, o modelo SFM-ETC-kSVM possuiu, na etapa de validação, precisão de 77,8%, sensibilidade de 75% e especificidade de 80%. Para a recidiva bioquímica, o modelo SFM- ETC-LDA obteve as figuras de mérito precisão, sensibilidade e especificidade, 80%, 87,5% e 60%, respectivamente. Para os seis conjuntos de dados avaliados, os modelos de classificação com regularização e treinados após seleção de variáveis e sobreamostragem obtiveram desempenho superior na generalização das predições do conjunto de validação, demonstrando a capacidade dessas técnicas na redução do sobreajuste. Mostrando também que a escolha apropriada de processamento de dados pode gerar modelos robustos, mesmo em dados pequenos e com grande dimensionalidade. Além disso, a técnica metabolômica baseada em RMN de 1 H se mostra uma alternativa interessante na redução de problemas durante o diagnóstico de CaP, podendo ser utilizado como uma ferramenta não invasiva para o auxílio médico no acompanhamento da doença. | pt_BR |
dc.language.iso | por | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | pt_BR |
dc.subject | Metabolômica | pt_BR |
dc.subject | Quimiometria | pt_BR |
dc.subject | Neoplasia | pt_BR |
dc.subject | Soro | pt_BR |
dc.subject | Espectroscopia | pt_BR |
dc.subject | Pré-processamento de dados | pt_BR |
dc.title | Otimização quimiométrica para ensaios metabonômicos baseados em espectroscopia de RMN : diagnóstico e estadiamento de câncer de próstata | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/9555918280848305 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | doutorado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/6974730097895255 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Quimica | pt_BR |
dc.description.abstractx | One of the challenges faced by metabonomic studies, using nuclear magnetic resonance (NMR) spectral data obtained from human biofluids, is the small number of samples compared to the number of generated variables. In addition to this, health data can also be imbalanced, leading to overfitting in chemometric models. Therefore, widely used machine learning techniques, such as feature selection, oversampling, and regularization, can be employed to mitigate these effects. In this study, aiming to demonstrate the capability of these techniques to address overfitting issues in two previously published sets of metabonomic data based on 1 H NMR, seven feature selection techniques and five classification methods after resampling were exhaustively tested, resulting in 43 possible combinations. Furthermore, for a novel dataset, the same exhaustive process was carried out to discover a chemometric formalism capable of discriminating between 38 individuals with prostate cancer (PCa) and 23 without the disease. Additionally, out of the 38 individuals with PCa, 27 who continued to be monitored were divided into three new preliminary metabonomic studies: (1) staging, consisting of fifteen patients with Gleason score ≤ 2 and twelve patients with Gleason score > 2; (2) risk of recurrence, composed of twelve patients with pathological category T, pT, < pT3, and negative surgical margin, and fifteen patients with classification ≥ pT3 or positive surgical margin; and (3) thirteen patients in cancer remission after prostatectomy and fourteen with biochemical recurrence. After this exhaustive search, for PCa diagnosis, the formalism with the best performance was GA-LDA, achieving sensitivity, specificity, and accuracy of 92%, 83%, and 88%, respectively, in external validation. For staging, the SFM-ETC-DT model achieved precision, sensitivity, and specificity of 88.9%, 75%, and 100%, respectively. Regarding the risk of biochemical recurrence, based on pT classification and surgical margin, the SFM-ETC- kSVM model demonstrated precision of 77.8%, sensitivity of 75%, and specificity of 80% in the validation stage. For biochemical recurrence, the SFM-ETC-LDA model obtained precision, sensitivity, and specificity figures of merit at 80%, 87.5%, and 60%, respectively. For the six evaluated datasets, regularization-based classification models trained after feature selection and oversampling demonstrated superior performance in generalizing predictions to the validation set, highlighting the effectiveness of these techniques in reducing overfitting. This emphasizes that appropriate data processing choices can yield robust models even with small and high-dimensional datasets. Furthermore, the metabonomic technique based on 1 H NMR proves to be an interesting alternative in addressing issues during PCa diagnosis, serving as a non-invasive tool for medical support in disease monitoring. | pt_BR |
Aparece nas coleções: | Teses de Doutorado - Química |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TESE Marcio Felipe de Oliveira.pdf | 7,18 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons