Please use this identifier to cite or link to this item: https://repositorio.ufjf.br/jspui/handle/ufjf/12727
Files in This Item:
File Description SizeFormat 
isabelalopespenna.pdfisabelalopespenna940.62 kBAdobe PDFThumbnail
View/Open
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Ferreira, Clécio da Silva-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/7842524715253287pt_BR
dc.contributor.referee1Ferreira, Clécio da Silva-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/7842524715253287pt_BR
dc.contributor.referee2Zeller, Camila Borelli-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/6671405481844657pt_BR
dc.contributor.referee3Magalhães, Tiago Maia-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/7953363504273397pt_BR
dc.creatorPenna, Isabela Lopes-
dc.creator.Latteshttp://lattes.cnpq.br/6463987865831581pt_BR
dc.date.accessioned2021-05-24T19:59:14Z-
dc.date.available2021-03-18-
dc.date.available2021-05-24T19:59:14Z-
dc.date.issued2021-03-17-
dc.identifier.urihttps://repositorio.ufjf.br/jspui/handle/ufjf/12727-
dc.description.abstractIn many cases, it is necessary to deal with databases with a large number of variables, bases called Big Data. In some situations it is necessary to reduce the number of these variables, either to have a model with only the significant variables or to solve problems such as multicollinearity. With this, several methods have emerged to solve the above cases. This work proposed to study the different selection methods in multiple linear regression models, such as methods of selecting subsets of variables, methods of regularization and methods of dimensionality reduction. Cross-validation procedures were used in the regularization processes for selecting the models. Real data applications were performed using the R Core Team software (2018).pt_BR
dc.description.resumoEm diversos casos é preciso lidar com bases de dados com um grande número de variáveis, bases essas denominadas Big Data. Em algumas situações se faz necessário reduzir o número dessas variáveis, seja para se ter um modelo apenas com as variáveis significativas ou para sanar problemas como multicolinearidade. Com isso surgiram vários métodos para solucionar os casos acima. Esse trabalho se propôs a estudar os diferentes métodos de seleção em modelos de regressão linear múltipla, como métodos de seleção de subconjuntos de variáveis, métodos de regularização e métodos de redução de dimensionalidade. Procedimentos de validação cruzada foram utilizados nos processos de regularização para seleção dos modelos. Aplicações em dados reais foram realizadas utilizando o software R Core Team (2018).pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Juiz de Fora (UFJF)pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentICE – Instituto de Ciências Exataspt_BR
dc.publisher.initialsUFJFpt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectSeleção de Variáveis Regressoraspt_BR
dc.subjectSelection of Regressor Variablespt_BR
dc.subjectMínimos Quadrados Parciaispt_BR
dc.subjectRidge Regressionpt_BR
dc.subjectRegressão Ridgept_BR
dc.subjectLASSO Regressionpt_BR
dc.subjectRegressão LASSOpt_BR
dc.subjectRegressão de Componentes Principaispt_BR
dc.subjectPartial Least Squarespt_BR
dc.subjectPrincipal Component Regressionpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICApt_BR
dc.titleSeleção de modelos de regressão linear em bases de alta dimensãopt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
Appears in Collections:Estatística - TCC Graduação



This item is licensed under a Creative Commons License Creative Commons