Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufjf.br/jspui/handle/ufjf/13433
Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
calvinsilvarodrigues.pdfCalvin Silva Rodrigues575.05 kBAdobe PDFVista previa
Visualizar/Abrir
Clase: Trabalho de Conclusão de Curso
Título : Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
Autor(es): Rodrigues, Calvin Silva
Orientador: Bessegato, Lupércio França
Miembros Examinadores: Bessegato, Lupércio França
Miembros Examinadores: Zeller, Camila Borelli
Miembros Examinadores: Lana, Gustavo de Carvalho
Resumo: Na última década, a quantidade de informações armazenadas no formato digital tem crescido exponencialmente, levando à necessidade cada vez maior de produção de procedimentos computacionalmente intensivos que auxiliem na geração de informação a partir desses dados. Dentre outras, a área de aprendizagem estatística não supervisionada fornece técnicas que auxiliam na obtenção de informação a partir desses dados sem que estejam associados a respostas. Dessa maneira, esse trabalho propôs estudar técnicas de agrupamento e de redução de dimensionalidade, a fim de explicar a configuração dos dados a partir de medida de distância entre objetos. Em redução de dimensionalidade foram explorados métodos de escalonamento multidimensional métrico e não métrico para visualizar previamente os possíveis grupos formados em um espaço de dimensão reduzida. Por sua vez, para agrupamento, foram utilizados os procedimentos K-médias, AGNES e DIANA, no qual o primeiro, que agrupa de maneira particionada, solicita previamente o número de grupos a ser formado, enquanto os demais, que agrupam hierarquicamente, contornam esse problema em troca da definição da medida de ligação entre grupos. Por fim, as metodologias estudadas foram aplicadas em conjuntos de dados reais com o software R Core Team (2020).
Resumen : In the last decade, the amount of information stored in digital format has grown exponentially, leading to the growing need to produce computationally intensive procedures that help generate information from this data. Among others, the area of unsupervised statistical learning provides techniques that help to obtain information from these data without being associated with answers. Thus, this work proposed to study clustering and dimensionality reduction techniques, in order to explain the data configuration based on measuring the distance between objects. In dimensionality reduction, metric and non-metric multidimensional scaling methods were explored to preview the possible groups formed in a reduced dimension space. In turn, for clustering, the K-means, AGNES and DIANA procedures were used. The first, which groups in a partitioned manner, previously requests the number of groups to be formed, while the others, which group hierarchically, bypass this problem in exchange for defining the measure of linkage between groups. Finally, the studied methodologies were applied to real datasets with the R Core Team software (2020).
Palabras clave : Aprendizagem não supervisionada
Unsupervised learning
Análise de agrupamento
Cluster analysis
Redução de dimensionalidade
Dimensionality reduction
Escalonamento multidimensional
Multidimensional scaling
Visualização multivariada
Multivariate visualization
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Idioma: por
País: Brasil
Editorial : Universidade Federal de Juiz de Fora (UFJF)
Sigla de la Instituición: UFJF
Departamento: ICE – Instituto de Ciências Exatas
Clase de Acesso: Acesso Aberto
Attribution-NonCommercial-NoDerivs 3.0 Brazil
Licenças Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/br/
URI : https://repositorio.ufjf.br/jspui/handle/ufjf/13433
Fecha de publicación : 10-sep-2021
Aparece en las colecciones: Estatística - TCC Graduação



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons