Please use this identifier to cite or link to this item: https://repositorio.ufjf.br/jspui/handle/ufjf/15052
Files in This Item:
File Description SizeFormat 
taleshumbertodeaquinoboratto.pdf24.71 MBAdobe PDFThumbnail
View/Open
Type: Dissertação
Title: Aprendizado de máquina para a classificação automática de pratos de bateria conforme a proporção de estanho presente em suas ligas de bronze
Author: Boratto, Tales Humberto de Aquino
First Advisor: Fonseca, Leonardo Goliatt da
Co-Advisor: Cury, Alexandre Abrahão
Referee Member: Aguiar, Eduardo Pestana de
Referee Member: Schiavoni, Flávio Luiz
Referee Member: Moura, Elineudo Pinho de
Resumo: Os diversos fatores que influenciam no som de um prato de bateria, combinados com os aspectos externos que modificam a sua percepção sonora, tornam o estudo da acústica destes instrumentos mais desafiadora. Pesquisas que focam no estudo de pratos de bateria são encontradas na literatura com diversas abordagens e métodos de investigação. Entretanto, ao considerar o contexto de aprendizado de máquina, a aplicação deste tipo de técnica para o estudo de pratos de bateria ainda é pouco explorada e, normalmente, foca na identificação das categorias de pratos e o modo como foram tocados. Dessa forma, o uso de ferramentas computacionais baseadas na aprendizagem de máquina para investigar os elementos acústicos destes instrumentos torna-se um tópico de estudo com potencial para ser desenvolvido. Inspirado nisso, este trabalho propõe a classificação de pratos de bateria conforme seus materiais constituintes, uma vez que a liga metálica assume uma parcela de responsabilidade significativa em sua acústica. Para tanto, um procedimento para a captura padronizada dos sons destes instrumentos foi desenvolvido e possibilitou construir uma base de dados composta por 276 áudios, referente a 4 pratos de bateria. Diferentes conjuntos de atributos, técnicas de seleção e classificadores foram avaliados, com a finalidade de propor um modelo computacional eficiente para a resolver tal problema. Como resultado, uma acurácia média de 99, 75% foi alcançada ao aplicar a regressão logística em um subconjunto de 30 atributos formados por 17 características temporais e 13 Coeficientes Mel-Cepstrais de Frequência (MFCC), selecionados por uma técnica baseada na análise do limiar de correlação entre as variáveis. Por outro lado, ao priorizar a dimensionalidade do subconjunto selecionado, a utilização de uma técnica de seleção baseada na regressão LASSO, seguida da análise de correlação, proporciona identificar um subconjunto de 5 atributos que promovem uma acurácia média de 99, 37%, também utilizando a regressão logística como classificador.
Abstract: The many factors that influence the sound of a cymbal, combined with the external aspects that modify its sound perception, make the study of the acoustics of these instruments more challenging. Research that focuses on the study of drum cymbals is found in the literature, with various approaches and methods of investigation. However, considering the context of machine learning, the application of this type of technique to the study of drum cymbals is still little explored and usually focus on identifying the categories of cymbals and the way they were played. Thus, the use of machine learning-based computational tools to investigate the acoustic elements of these instruments becomes a topic of study with potential for further development. Inspired by this, this paper proposes classifying drum cymbals according to their constituent materials, since the metal alloy assumes a significant share of responsibility in their acoustics. To this end, a procedure for the standardized capture of the sounds of these instruments was developed and allowed to build a database consisting of 276 audios, referring to 4 cymbals. Different sets of attributes, selection techniques and classifiers were evaluated in order to propose an efficient computational model to solve this problem. As a result, an average accuracy of 99.75% was achieved when applying logistic regression on a subset of 30 attributes formed by 17 temporal features and 13 Mel-Frequency Cepstral Coefficients, selected by a technique based on the analysis of the correlation threshold between variables. On the other hand, when prioritizing the dimensionality of the selected subset, the use of a selection technique based on LASSO regression followed by correlation analysis, provides to identify a subset of 5 attributes that promote an average accuracy of 99.37%, also using logistic regression as a classifier.
Keywords: Aprendizado de máquina
Computação musical
Ligas de bronze
Pratos de bateria
Reconhecimento de materiais
Machine learning
Music computing
Bronze alloys
Cymbals
Material recognition
CNPq: CNPQ::ENGENHARIAS
Language: por
Country: Brasil
Publisher: Universidade Federal de Juiz de Fora (UFJF)
Institution Initials: UFJF
Department: Faculdade de Engenharia
Program: Programa de Pós-graduação em Modelagem Computacional
Access Type: Acesso Aberto
Attribution-ShareAlike 3.0 Brazil
Creative Commons License: http://creativecommons.org/licenses/by-sa/3.0/br/
DOI: https://doi.org/10.34019/ufjf/di/2022/00396
URI: https://repositorio.ufjf.br/jspui/handle/ufjf/15052
Issue Date: 18-Nov-2022
Appears in Collections:Mestrado em Modelagem Computacional (Dissertações)



This item is licensed under a Creative Commons License Creative Commons