尼日利亚ORIN音乐数据集:深度分析与XGBoost流派分类模型

PDF格式 | 2.4MB | 更新于2025-01-16 | 129 浏览量 | 0 下载量 举报
收藏
尼日利亚歌曲分类的机器学习模型及ORIN数据集分析 本文探讨了音乐信息检索(MIR)在尼日利亚音乐领域的应用,特别是在自动流派分类方面的发展。以往的研究在该地区相对较少,因此本文提出了一项创新性的工作,即开发了一个名为ORIN的数据集,专门包含478首来自尼日利亚传统音乐五大流派(富士、juju、highlife、waka和apala)的歌曲样本。作者A.Abolabib和AdeoyeB.奥沃德依来自尼日利亚奥贡州Ago-IwoyeOlubisiOnabanjo大学数学科学系以及南非的Africa4AI,他们利用Librosa Python库挖掘出每首歌曲的音色纹理和节奏特征作为关键输入。 研究采用多种分类器,包括k-最近邻、支持向量机、极端梯度提升(XGBoost)和随机森林,对ORIN数据集进行训练。结果表明,XGBoost分类器表现出色,达到了81.94%的高准确率和84.57%的召回率,显示出其在尼日利亚音乐流派识别中的优越性能。为了深入了解特征的重要性,作者采用了全局均值(TreeSHAP)方法进行分析,这有助于揭示哪些音乐特性对分类决策影响最大。 进一步的流派间分析揭示了某些流派之间在音色属性上的相似性,这与人类观察的结果相吻合。这不仅展示了机器学习在音乐分析中的实用性,也揭示了尼日利亚音乐文化中的潜在规律。文章以开放获取的形式发表,遵循CCBY-NC-ND许可证,允许在学术界自由分享和非商业性使用。 这篇研究为尼日利亚音乐的自动分类提供了新的数据支持和技术方法,对于音乐信息检索领域的研究者和爱好者来说,它拓宽了对非洲音乐理解的视角,也为未来在其他地区或音乐风格上的研究提供了可借鉴的案例。

相关推荐