https://repositorio.ufjf.br/jspui/handle/ufjf/18223
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
danielaschimitzdecarvalho.pdf | 15.27 MB | Adobe PDF | ![]() Visualizar/Abrir |
Tipo: | Tese |
Título: | Avanços em modelos computacionais para predição da sobrevida para o câncer de mama feminino |
Autor(es): | Carvalho, Daniela Schimitz de |
Primeiro Orientador: | Goliatt, Priscila Vanessa Zabala Capriles |
Co-orientador: | Parente, Marco Paulo Lages |
Membro da banca: | Borges, Carlos Crisano Hasenclever |
Membro da banca: | Teixeira, Maria Teresa Bustamante |
Membro da banca: | Silva, Eduardo Krempser da |
Membro da banca: | Domingues, Inês Campos Monteiro Sabino |
Resumo: | O Câncer de Mama (CM) é uma das principais causas de morte entre mulheres, sendo frequentemente diagnosticado e tratado tardiamente, o que contribui para as altas taxas de mortalidade. A aplicação de métodos de Aprendizado de Máquina (AM) tem demonstrado grande potencial na predição de desfechos em doenças oncológicas. Este estudo teve como objetivo identificar e avaliar os atributos prognósticos para a predição da sobrevida de pacientes com CM feminino, por meio de modelos computacionais. A pesquisa envolveu a construção e análise de um Banco de Dados (BD) clínico contendo informações de pacientes da Zona da Mata Mineira. Após a obtenção dos dados, foram realizadas etapas de pré-processamento, com uma primeira fase de imputação simples e uma segunda fase de inferência dos valores ausentes, considerando a análise descritiva, a correlação entre os dados e a significância clínica de cada variável. As variáveis correlacionadas acima de 70% foram analisadas novamente, levando em conta sua relevância clínica, e, a partir disso, foram selecionadas as variáveis mais significativas. Essas variáveis passaram então por métodos de seleção de atributos, etapas essenciais para aprimorar a precisão dos modelos e identificar fatores críticos na predição da sobrevida. Com base nessa base de dados, foram avaliados diferentes métodos AM, incluindo modelos lineares, como a Regressão de Cox Proportional-Hazards (CPH), tanto não penalizada quanto penalizada (Lasso e Elastic Net), além de Survival Support Vector Machine (SSVM). Também foram testados modelos não lineares, como Random Survival Forest (RSF), Gradient Boosting Survival (GBS) e Kernel Survival Support Vector Machine (KSSVM). A avaliação do desempenho, utilizando métricas específicas para análise de sobrevida, indicou que o RSF obteve o melhor desempenho entre os modelos avaliados.O estudo também destacou a importância do pré-processamento dos dados e da aplicação dos métodos de seleção de atributos, que foram fundamentais para a identificação de variáveis prognósticas relevantes para a prática clínica. Além disso, foram discutidos os impactos dessa abordagem computacional na tomada de decisões clínicas. Os resultados evidenciam o potencial dos modelos computacionais na predição da sobrevida de pacientes com CM feminino, e essa pesquisa contribui para o avanço da oncologia computacional, com a possibilidade de melhorar prognósticos e a qualidade de vida das pacientes. |
Abstract: | Breast Cancer is one of the leading causes of death among women, often diagnosed and treated at advanced stages, which contributes to high mortality rates. The application of Machine Learning methods has shown great potential in predicting outcomes in oncological diseases. This study aimed to identify and evaluate prognostic attributes for predicting the survival of female BC patients through computational models. The research involved the construction and analysis of a clinical Database containing information from patients in the Zona da Mata region of Minas Gerais. After data collection, preprocessing steps were carried out, beginning with a simple imputation phase followed by a second phase of inferring missing values, considering descriptive analysis, data correlation, and the clinical significance of each variable. Variables with a correlation above 70% were reanalyzed, taking into account their clinical relevance, and the most significant variables were selected. These variables were then subjected to feature selection methods, which were essential to enhance model accuracy and identify critical factors in survival prediction. Based on this database, different ML methods were evaluated, including linear models, such as Cox Proportional-Hazards Regression, both non-penalized and penalized (Lasso and Elastic Net), as well as Survival Support Vector Machine. Non-linear models, such as Random Survival Forest, Gradient Boosting Survival, and Kernel Survival Support Vector Machine, were also tested. Performance evaluation, using specific survival analysis metrics, showed that Random Survival Forest outperformed the other models. The study also highlighted the importance of data preprocessing and the application of feature selection methods, which were crucial in identifying relevant prognostic variables for clinical practice. Additionally, the impacts of this computational approach on clinical decision-making were discussed. The results underscore the potential of computational models in predicting the survival of female BC patients, and this research contributes to the advancement of computational oncology, with the potential to improve prognoses and patients’ quality of life. |
Palavras-chave: | Análise de sobrevida Aprendizado de máquina Neoplasia da mama Survival analysis Machine learning Breast neoplasm |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Juiz de Fora (UFJF) |
Sigla da Instituição: | UFJF |
Departamento: | ICE – Instituto de Ciências Exatas |
Programa: | Programa de Pós-graduação em Modelagem Computacional |
Tipo de Acesso: | Acesso Aberto Attribution-NoDerivs 3.0 Brazil |
Licenças Creative Commons: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
URI: | https://repositorio.ufjf.br/jspui/handle/ufjf/18223 |
Data do documento: | 20-Dez-2024 |
Aparece nas coleções: | Doutorado em Modelagem Computacional (Teses) |
Este item está licenciado sob uma Licença Creative Commons