Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufjf.br/jspui/handle/ufjf/4766
Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
camilamariacampos.pdf907.74 kBAdobe PDFVista previa
Visualizar/Abrir
Clase: Dissertação
Título : Comitê de classificadores em bases de dados transacionais desbalanceadas com seleção de características baseada em padrões minerados
Autor(es): Campos, Camila Maria
Orientador: Borges, Carlos Cristiano Hasenclever
Miembros Examinadores: Menezes, Victor Ströele de Andrade
Miembros Examinadores: Bernardino, Heder Soares
Miembros Examinadores: Pitangui, Cristiano Grijó
Resumo: Os resultados dos problemas de classificação por regras de associação sofrem grande influência da estrutura dos dados que estão sendo utilizados. Uma dificuldade na área é a resolução de problemas de classificação quando se trata de bases de dados desbalanceadas. Assim, o presente trabalho apresenta um estudo sobre desbalanceamento em bases de dados transacionais, abordando os principais métodos utilizados na resolução do problema de desbalanceamento. Além disso, no que tange ao desbalanceamento, este trabalho propõe um modelo para realizar o balanceamento entre classes, sendo realizados experimentos com diferentes mé- todos de balanceamento e métodos ensemble, baseados em comitê de classificadores. Tais experimentos foram realizados em bases transacionais e não transacionais com o intuito de validar o modelo proposto e melhorar a predição do algoritmo de classificação por regras de associação. Bases de dados não transacionais também foram utilizadas nos ex perimentos, com o objetivo de verificar o comportamento do modelo proposto em tais bases. Outro fator importante no processo de classificação é a dimensão da base de dados que, quando muito grande, pode comprometer o desempenho dos classificadores. Neste traba lho, também é proposto um modelo de seleção de características baseado na classificação por regras de associação. Para validar o modelo proposto, também foram realizados ex- perimentos aplicando diferentes métodos de seleção nas bases de dados. Os resultados da classificação obtidos utilizando as bases contendo as características selecionadas pelos me- todos, foram comparados para validar o modelo proposto, tais resultados apresentaram-se satisfatórios em relação aos demais métodos de seleção.
Resumen : The results of Classification Based on Associations Rules (CBA) are greatly influenced by the used data structure. A difficulty in this area is solving classification problems when it comes to unbalanced databases. Thus, this paper presents a study of unbalance in transactional and non-transactional databases, addressing the main methods used to solve the unbalance problem. In addition, with respect to the unbalance problem, this paper proposes a model to reach the balance between classes, conducting experiments with different methods of balancing and ensemble methods based on classifiers committee. These experiments were performed in transactional and non-transactional databases, in order to validate the proposed model and improve Classification Based on Associations Rules prediction. Another important factor in the classification process is database dimensionality, be cause when too large, it can compromise the classifiers performance. In this work, it is also proposed a feature selection model based on the rules of CBA. Aiming to validate this model, experiments were also performed applying different features selection methods in the databases.The classification results obtained using the bases containing the features selected by the methods were compared to validate the proposed model, these results were satisfactory in comparison with other methods of selection.
Palabras clave : Mineração dados
Regra de associação
Classificação
Balanceamento em bases de dados
Seleção de características
Data Mining
Association Rule
Classification
Balancing Database
Feature Selection
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editorial : Universidade Federal de Juiz de Fora (UFJF)
Sigla de la Instituición: UFJF
Departamento: ICE – Instituto de Ciências Exatas
Programa: Programa de Pós-graduação em Ciência da Computação
Clase de Acesso: Acesso Aberto
URI : https://repositorio.ufjf.br/jspui/handle/ufjf/4766
Fecha de publicación : 29-ene-2016
Aparece en las colecciones: Mestrado em Ciência da Computação (Dissertações)



Los ítems de DSpace están protegidos por licencias Creative Commons, con todos los derechos reservados, a menos que se indique lo contrario.