Predição de músicas utilizando redes neurais recorrentes
Visualizar/abrir
Data
2025Orientador
Nível acadêmico
Graduação
Assunto
Resumo
A predição musical, embora pouco explorada na literatura, oferece uma miríade de possibilidades de aplicações de metodologias estatísticas, especialmente métodos de aprendizado de máquina, dada a natureza criativa do processo de composição musical. Por se tratar de um tema incipiente, o desenvolvimento deste trabalho tem por objetivo propor e analisar a arquitetura de uma rede neural recorrente que interprete arquivos de áudio sob a perspectiva de séries temporais de frequências fundamentais, b ...
A predição musical, embora pouco explorada na literatura, oferece uma miríade de possibilidades de aplicações de metodologias estatísticas, especialmente métodos de aprendizado de máquina, dada a natureza criativa do processo de composição musical. Por se tratar de um tema incipiente, o desenvolvimento deste trabalho tem por objetivo propor e analisar a arquitetura de uma rede neural recorrente que interprete arquivos de áudio sob a perspectiva de séries temporais de frequências fundamentais, baseada em uma metodologia de modelos de classe Long Short-Term Memory. A avaliação do desempenho se deu pela utilização de medidas de erros quadráticos médios e de erros absolutos médios percentuais, bem como análises pontuais por gênero musical foram consideradas. Constatou-se que o modelo se ajusta melhor a músicas em que o gênero musical principal seja homogêneo em suas características, como ritmos e cadências, fornecendo dados de performance do modelo para comparações de uma maneira geral e segmentada por gênero. Além disso, discutiu-se sobre a influência de elementos intrínsecos do objeto de estudo sobre o treinamento do modelo e como diferentes configurações de taxas de amostragem de áudio e intervalos de frequência na estimação da frequência fundamental podem interferir no processo de aprendizagem de máquina. ...
Abstract
Music prediction, although little explored in the literature, offers a myriad of possibilities for the application of statistical methodologies, especially machine learning methods, given the creative nature of the music composition process. Since this is an incipient topic, the development presented in this work aims to propose and analyze the architecture of a recurrent neural network that interprets audio files as time series of fundamental frequencies, based on a Long Short-Term Memory clas ...
Music prediction, although little explored in the literature, offers a myriad of possibilities for the application of statistical methodologies, especially machine learning methods, given the creative nature of the music composition process. Since this is an incipient topic, the development presented in this work aims to propose and analyze the architecture of a recurrent neural network that interprets audio files as time series of fundamental frequencies, based on a Long Short-Term Memory class model methodology. The performance evaluation was carried out using mean squared error measures and mean absolute percentage error, and specific analyses by musical genre are considered. It was found that the model fits better to songs in which the main musical genre is homogeneous in its characteristics, such as rhythms and cadences, providing model performance data for comparisons, in a general way and segmented by genre. Furthermore, the influence of intrinsic elements of the object of study on the training of the model was discussed, and how different configurations of audio sampling rates and frequency ranges in the estimation of the fundamental frequency can interfere in the machine learning process. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Matemática e Estatística. Curso de Estatística: Bacharelado.
Coleções
-
TCC Estatística (302)
Este item está licenciado na Creative Commons License
