Please use this identifier to cite or link to this item: https://repositorio.ufjf.br/jspui/handle/ufjf/19618
Files in This Item:
File Description SizeFormat 
jaquelinelamasdasilva.pdf10.14 MBAdobe PDFView/Open
Type: Trabalho de Conclusão de Curso
Title: Misturas finitas de modelos parcialmente lineares: uma abordagem via P-splines para estimação das componentes não paramétricas
Author: Silva, Jaqueline Lamas
First Advisor: Zeller, Camila Borelli
Co-Advisor: Ferreira, Clécio da Silva
Referee Member: Bastos, Ronaldo Rocha
Referee Member: Magalhães, Tiago Maia
Resumo: Os modelos de regressão, consolidados ao longo do desenvolvimento estatístico, permanecem como ferramenta primordial para investigar relações entre preditores e desfechos. Em sua formulação clássica, esse tipo de modelo assume que as observações são provenientes de uma única população homogênea. No entanto, na prática, características não observadas podem gerar comportamentos distintos entre subgrupos de observações. Em tais circunstâncias, podemos utilizar modelos de mistura de regressão para incorporar essa heterogeneidade ao modelo, estimando não apenas os parâmetros específicos de cada componente da mistura (subgrupo), mas também as probabilidades a posteriori de cada observação pertencer a cada componente, as quais podem ser utilizadas em contextos de classificação e clusterização (ou agrupamento) no âmbito de aprendizagem supervisionada e não supervisionada, respectivamente. No presente trabalho, estudamos misturas de modelos parcialmente lineares com a adoção de P-splines para estimação das componentes não-paramétricas. Nossa configuração permite que diferentes covariáveis lineares e não lineares componham a estrutura semiparamétrica de cada grupo. Os estimadores de máxima verossimilhança penalizada foram obtidos através de um algoritmo do tipo EM, enquanto os erros padrão foram calculados via matriz de informação empírica. Para a seleção dos parâmetros de suavização das curvas e do número de grupos, utilizamos o critério de informação Bayesiano (BIC). A metodologia proposta foi avaliada através de estudos de simulação e por meio de aplicação a dados reais. Além disso, na aplicação a qualidade do ajuste foi verificada através da construção de envelopes simulados baseados nos resíduos quantílicos.
Abstract: Regression models, well-established in statistical development, remain a primary tool for investigating relationships between predictors and outcomes. In their classical formulation, these models assume that observations come from a single homogeneous population. However, in practice, unobserved characteristics may lead to distinct behaviors among observation subgroups. In such circumstances, we can employ regression mixture models to incorporate this heterogeneity, estimating not only the specific parameters of each mixture component (subgroup) but also the posterior probabilities of each observation belonging to each component - which can be used in classification and clustering contexts, in the framework of supervised and unsupervised learning, respectively. In this work, we study mixtures of partially linear models using P-splines for estimating the nonparametric components. Our configuration allows different linear and nonlinear covariates to composse the semiparametric structure of each group. The penalized maximum likelihood estimators were obtained through an EM-type algorithm, while standard errors were calculated via the empirical information matrix. For selecting the curve smoothing parameters and the number of groups, we used the Bayesian Information Criterion (BIC). The proposed methodology was evaluated through simulation studies and real data applications. Furthermore, in the application, the goodness-of-fit was verified by constructing simulated envelopes based on randomized quantile residuals.
Keywords: Misturas finitas
Modelos parcialmente lineares
P-splines
Algoritmo EM
Finite mixtures
Partially linear models
P-splines
EM algorithm
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA
Language: por
Country: Brasil
Publisher: Universidade Federal de Juiz de Fora (UFJF)
Institution Initials: UFJF
Department: ICE – Instituto de Ciências Exatas
Access Type: Acesso Aberto
URI: https://repositorio.ufjf.br/jspui/handle/ufjf/19618
Issue Date: 25-Aug-2025
Appears in Collections:Estatística - TCC Graduação



Items in DSpace are protected by Creative Commons licenses, with all rights reserved, unless otherwise indicated.