Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufjf.br/jspui/handle/ufjf/5906
Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
marceloladeiramarques.pdf704.89 kBAdobe PDFVista previa
Visualizar/Abrir
Clase: Dissertação
Título : Uma abordagem baseada em classificadores de larga margem para geração de dados artificiais em bases desbalanceadas
Autor(es): Marques, Marcelo Ladeira
Orientador: Borges, Carlos Cristiano Hasenclever
Co-orientador: Villela, Saulo Moraes
Miembros Examinadores: Fonseca Neto, Raul
Miembros Examinadores: Braga, Antônio de Pádua
Resumo: O presente trabalho tem como proposta o desenvolvimento de uma abordagem capaz de melhorar os resultados obtidos por algoritmos de classificação quando aplicados em bases desbalanceadas. O método, denominado Algoritmo de Balanceamento Sintético In-cremental (Incremental Synthetic Balancing Algorithm – ISBA), realiza um procedimento iterativo baseado em classificadores de larga margem, visando gerar amostras sintéticas com o intuito de reduzir o nível de desbalanceamento. No processo são utilizados vetores suporte como referência para a geração das novas instâncias, permitindo posicioná-las em regiões com uma maior representatividade. Além disso, a estratégia permite que as novas amostras ultrapassem os limites das amostras utilizadas como referência para sua geração, o que possibilita uma extrapolação dos limites da classe minoritária, objetivando, assim, alcançar um maior reconhecimento dessa classe de interesse. São apresentados experimentos comparativos com demais técnicas, entre elas o Synthetic Minority Over-sampling Technique (SMOTE), os quais fornecem fortes evidências da aplicabilidade da abordagem proposta.
Resumen : In this work we propose the development of an approach capable of improving the results obtained by classification algorithms when applied to unbalanced datasets. The method, called Incremental Synthetic Balancing Algorithm (ISBA), performs an iterative procedure based on large margin classifiers, aiming to generate synthetic samples in order to reduce the level of unbalance. In the process, we use the support vectors as reference for the generation of new instances, allowing them to be positioned in regions with greater representativeness. Furthermore, the strategy allows the new samples to exceed the limits of the samples used as reference for their generation, which allows an extrapolation of the limits of the minority class, in order to achieve greater recognition of this class of interest. We present comparative experiments with other techniques, among them the Synthetic Minority Over-sampling Technique (SMOTE), which provide strong evidence of the applicability of the proposed approach.
Palabras clave : Aprendizado desbalanceado
Classificadores de larga margem
Reamostragem
Geração de dados artificiais
Unbalanced learning
Large margin classifiers
Oversampling
Synthetic sample generation
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA
Idioma: por
País: Brasil
Editorial : Universidade Federal de Juiz de Fora (UFJF)
Sigla de la Instituición: UFJF
Departamento: ICE – Instituto de Ciências Exatas
Programa: Programa de Pós-graduação em Ciência da Computação
Clase de Acesso: Acesso Aberto
URI : https://repositorio.ufjf.br/jspui/handle/ufjf/5906
Fecha de publicación : 1-sep-2017
Aparece en las colecciones: Mestrado em Ciência da Computação (Dissertações)



Los ítems de DSpace están protegidos por licencias Creative Commons, con todos los derechos reservados, a menos que se indique lo contrario.