https://repositorio.ufjf.br/jspui/handle/ufjf/17938
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
matheusramossiqueiranunes.pdf | PDF/A | 675.12 kB | Adobe PDF | Visualizar/Abrir |
Tipo: | Trabalho de Conclusão de Curso |
Título: | Aplicação da regressão Dirichlet na modelagem do desempenho dos campeões dos principais campeonatos de futebol |
Autor(es): | Nunes, Matheus Ramos Siqueira |
Primeiro Orientador: | Magalhães, Tiago Maia |
Membro da banca: | Dias, Bárbara da Costa Campos |
Membro da banca: | Ferreira, Clécio da Silva |
Resumo: | Dados composicionais descrevem parte de um todo, geralmente somando um, no caso de proporções, ou cem, no caso de porcentagens. Os métodos tradicionais de análise multivariada não se mostram adequados para a manipulação deste tipo de dados. Nesta monografia são abordados os métodos para análises de dados composicionais, desde o espaço amostral adequado, chamado Simplex, operações composicionais, as transformações log-razão até a visualização de dados. Em particular, é abordado o caso em que as composições são as variáveis preditoras de uma análise de regressão. Assim, foi discutido o modelo de regressão Dirichlet e o processo de estimação pelo Método da Máxima Verossimilhança. Para avaliar a eficácia deste modelo de regressão, são feitas simulações através do método de Monte Carlo para a estimação de parâmetros de regressão, em que se verificou tendência de aproximação das estimativas aos parâmetros conforme aumento do tamanho da amostra. Posteriormente, são feitas aplicações nas bases de dados do Lago Ártico, de campeões brasileiros de futebol e de campeões nacionais de futebol no ano de 2022. Nestas aplicações são empregadas as técnicas de visualização, estatísticas descritivas e regressão adequadas aos dados. Para os dois últimos conjuntos de dados, foram escolhidas a composição de vitórias, empates e derrotas como variáveis resposta e ajustado um modelo de regressão Dirichlet, sendo possível perceber o comportamento desta composição nos campeões nacionais de futebol. |
Abstract: | Compositional data describe parts of a whole, usually summing to one in the case of proportions, or one hundred in the case of percentages. Traditional multivariate analysis methods are not suitable for handling this type of data. This thesis addresses methods for analyzing compositional data, covering topics such as the appropriate sample space, known as the Simplex, compositional operations, log-ratio transformations, and data visualization. In particular, it focuses on cases where compositions are the predictor variables in a regression analysis. The Dirichlet regression model and the estimation process through the Maximum Likelihood Method are discussed. To evaluate the effectiveness of this regression model, simulations were performed using the Monte Carlo method for parameter estimation, revealing a tendency for the estimates to converge toward the parameters as the sample size increased. Subsequently, applications were made to the Arctic Lake dataset, Brazilian football champions, and national football champions in 2022. In these applications, visualization techniques, descriptive statistics, and regression appropriate for compositional data were employed. For the latter two datasets, the composition of wins, draws, and losses was chosen as the response variable, and a Dirichlet regression model was fitted, allowing for insights into the behavior of this composition among national football champions. |
Palavras-chave: | Dados composicionais Regressão Dirichlet Simulação de Monte Carlo Compositional data Dirichlet regression Monte Carlo simulation |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Juiz de Fora (UFJF) |
Sigla da Instituição: | UFJF |
Departamento: | ICE – Instituto de Ciências Exatas |
Tipo de Acesso: | Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 Brazil |
Licenças Creative Commons: | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
URI: | https://repositorio.ufjf.br/jspui/handle/ufjf/17938 |
Data do documento: | 2-Out-2024 |
Aparece nas coleções: | Estatística - TCC Graduação |
Este item está licenciado sob uma Licença Creative Commons