Please use this identifier to cite or link to this item: https://repositorio.ufjf.br/jspui/handle/ufjf/18223
Files in This Item:
File Description SizeFormat 
danielaschimitzdecarvalho.pdf15.27 MBAdobe PDFThumbnail
View/Open
Type: Tese
Title: Avanços em modelos computacionais para predição da sobrevida para o câncer de mama feminino
Author: Carvalho, Daniela Schimitz de
First Advisor: Goliatt, Priscila Vanessa Zabala Capriles
Co-Advisor: Parente, Marco Paulo Lages
Referee Member: Borges, Carlos Crisano Hasenclever
Referee Member: Teixeira, Maria Teresa Bustamante
Referee Member: Silva, Eduardo Krempser da
Referee Member: Domingues, Inês Campos Monteiro Sabino
Resumo: O Câncer de Mama (CM) é uma das principais causas de morte entre mulheres, sendo frequentemente diagnosticado e tratado tardiamente, o que contribui para as altas taxas de mortalidade. A aplicação de métodos de Aprendizado de Máquina (AM) tem demonstrado grande potencial na predição de desfechos em doenças oncológicas. Este estudo teve como objetivo identificar e avaliar os atributos prognósticos para a predição da sobrevida de pacientes com CM feminino, por meio de modelos computacionais. A pesquisa envolveu a construção e análise de um Banco de Dados (BD) clínico contendo informações de pacientes da Zona da Mata Mineira. Após a obtenção dos dados, foram realizadas etapas de pré-processamento, com uma primeira fase de imputação simples e uma segunda fase de inferência dos valores ausentes, considerando a análise descritiva, a correlação entre os dados e a significância clínica de cada variável. As variáveis correlacionadas acima de 70% foram analisadas novamente, levando em conta sua relevância clínica, e, a partir disso, foram selecionadas as variáveis mais significativas. Essas variáveis passaram então por métodos de seleção de atributos, etapas essenciais para aprimorar a precisão dos modelos e identificar fatores críticos na predição da sobrevida. Com base nessa base de dados, foram avaliados diferentes métodos AM, incluindo modelos lineares, como a Regressão de Cox Proportional-Hazards (CPH), tanto não penalizada quanto penalizada (Lasso e Elastic Net), além de Survival Support Vector Machine (SSVM). Também foram testados modelos não lineares, como Random Survival Forest (RSF), Gradient Boosting Survival (GBS) e Kernel Survival Support Vector Machine (KSSVM). A avaliação do desempenho, utilizando métricas específicas para análise de sobrevida, indicou que o RSF obteve o melhor desempenho entre os modelos avaliados.O estudo também destacou a importância do pré-processamento dos dados e da aplicação dos métodos de seleção de atributos, que foram fundamentais para a identificação de variáveis prognósticas relevantes para a prática clínica. Além disso, foram discutidos os impactos dessa abordagem computacional na tomada de decisões clínicas. Os resultados evidenciam o potencial dos modelos computacionais na predição da sobrevida de pacientes com CM feminino, e essa pesquisa contribui para o avanço da oncologia computacional, com a possibilidade de melhorar prognósticos e a qualidade de vida das pacientes.
Abstract: Breast Cancer is one of the leading causes of death among women, often diagnosed and treated at advanced stages, which contributes to high mortality rates. The application of Machine Learning methods has shown great potential in predicting outcomes in oncological diseases. This study aimed to identify and evaluate prognostic attributes for predicting the survival of female BC patients through computational models. The research involved the construction and analysis of a clinical Database containing information from patients in the Zona da Mata region of Minas Gerais. After data collection, preprocessing steps were carried out, beginning with a simple imputation phase followed by a second phase of inferring missing values, considering descriptive analysis, data correlation, and the clinical significance of each variable. Variables with a correlation above 70% were reanalyzed, taking into account their clinical relevance, and the most significant variables were selected. These variables were then subjected to feature selection methods, which were essential to enhance model accuracy and identify critical factors in survival prediction. Based on this database, different ML methods were evaluated, including linear models, such as Cox Proportional-Hazards Regression, both non-penalized and penalized (Lasso and Elastic Net), as well as Survival Support Vector Machine. Non-linear models, such as Random Survival Forest, Gradient Boosting Survival, and Kernel Survival Support Vector Machine, were also tested. Performance evaluation, using specific survival analysis metrics, showed that Random Survival Forest outperformed the other models. The study also highlighted the importance of data preprocessing and the application of feature selection methods, which were crucial in identifying relevant prognostic variables for clinical practice. Additionally, the impacts of this computational approach on clinical decision-making were discussed. The results underscore the potential of computational models in predicting the survival of female BC patients, and this research contributes to the advancement of computational oncology, with the potential to improve prognoses and patients’ quality of life.
Keywords: Análise de sobrevida
Aprendizado de máquina
Neoplasia da mama
Survival analysis
Machine learning
Breast neoplasm
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA
Language: por
Country: Brasil
Publisher: Universidade Federal de Juiz de Fora (UFJF)
Institution Initials: UFJF
Department: ICE – Instituto de Ciências Exatas
Program: Programa de Pós-graduação em Modelagem Computacional
Access Type: Acesso Aberto
Attribution-NoDerivs 3.0 Brazil
Creative Commons License: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufjf.br/jspui/handle/ufjf/18223
Issue Date: 20-Dec-2024
Appears in Collections:Doutorado em Modelagem Computacional (Teses)



This item is licensed under a Creative Commons License Creative Commons