没有合适的资源?快使用搜索试试~ 我知道了~
软件影响15(2023)100462原始软件出版物Swaragram:印度音乐音乐特征的软件工具箱YeshwantSingh,Lilapati Waikhom,Anupam Biswas印度阿萨姆邦锡尔查尔国家技术学院计算机科学与工程系A R T I C L E I N F O保留字:印度古典音乐音乐特色神经网络Raag辨识A B标准我们提出了一个旋律的音乐功能和工具箱更可取的印度古典音乐,主音信息和微主音音阶(Shruti)。在西方音乐中广泛用于计算分析的Chromagram功能启发了我们的功能方法。该功能的性能进行评估Raag识别,并在同一数据集上的其他方法相媲美。我们还介绍了工具箱的一些应用。代码元数据当前代码版本v1.0用于此代码版本的代码/存储库的永久链接https://github.com/SoftwareImpacts/SIMPAC-2022-295Reproducible Capsule的永久链接https://codeocean.com/capsule/0439633/tree/v1法律代码许可证GPL-3.0许可证使用Git的代码版本控制系统使用Python的软件代码语言、工具和服务编译要求,操作环境依赖性Python库的依赖性:essentia,audioread,librosa,numba==0.48.0,numpy,PySoundFile,scipy如果可用,链接到开发人员文档/手册https://github.com/yeshwantsingh/swaragram/blob/master/core.md,https://github.com/yeshwantsingh/swaragram/blob/master/utils.md问题支持电子邮件yeshwantsingh6@gmail.com1. 介绍印度次大陆古典音乐的起源可以追溯到公元前1500年,据说在《萨马吠陀》(印度圣书)中有描述。它已经发展到宝莱坞音乐和几个区域民间形式的当代趋势。印度古典音乐(ICM)遵循既定的音乐规则和实践,允许艺术家在他们认为合适的时候在作品中加入即兴创作。音乐理论和对ICM音乐思想的理解是通过口头传统从咕噜(教师)传递给他/她的Shishyas(学生)的,这是只有咕噜才有的非正统方式[1]。萨干与西方五线谱通常用于教育、娱乐和音乐记录。然而,没有标准的书面符号为印度古典音乐(ICM)首席艺术家讨论即将到来的表演,他/她将与随行艺术家一起使用Tala(节奏)和Raag1等概念进行表演。西方古典音乐中的音阶是固定的,作曲也是基于固定的基调。与此相反,ICM是动态的,并根据首席艺术家选择的潜在Tonic而变化。Saptak(八度)分为22个微音(如图所示在表1中),每一个都命名为一个特定的Shruti [3]。第一个Shruti,Sa(称为Shadja),是ICM中音乐作品的主音;其他Shruti根据Shadja采用各自的位置。这种理解为ICM音乐家提供了很大的自由。Shadja在表演中被加强以供参考,并在Tabla或Tanpura等乐器上演奏。Shadja与所有其他Shruti的比例本文中的代码(和数据)已由Code Ocean认证为可复制:(https://codeocean.com/)。更多关于生殖器的信息徽章倡议可在https://www.elsevier.com/physical-sciences-and-engineering/computer-science/journals上查阅。∗ 通讯作者。电子邮件地址:yeshwant_rs@cse.nits.ac.in(Y. Singh),lilapati_rs@cse.nits.ac.in(L. Waikhom),anupam@cse.nits.ac.in(A.Biswas)。1 Raag是印度古典音乐的旋律结构,有Pakad(特征短语),Vadi(国王音符)和Samvadi(女王音符)等语法,等https://doi.org/10.1016/j.simpa.2022.100462接收日期:2022年12月5日;接收日期:2022年12月21日;接受日期:2022年12月27日2665-9638/©2022作者。由Elsevier B.V.出版。这是一篇开放获取的文章,使用CC BY许可证(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表软件影响杂志 首页:www.journals.elsevier.com/software-impactsY.辛格湖,澳-地Waikhom和A. 比斯瓦斯软件影响15(2023)100462212.13.第256/243号决定 Teevratam Madhyam m2 729/5123.14.第16/15集Pancham P 3/24.15.第一次的约会Ati Komal Dhaivat d1 128/815.16.第16集Komal Dhaivat d2 8/56.17.第一次的约会Shuddha Dhaivat D1 5/37.18.第18集Teevra Dhaivat D2 27/168.19.第一次约会Ati Komal Nishad 16/99.20.第十一届全国人大代表Komal Nishad n2 9/510.21.第二十一章大结局Shuddha Nishad N1 15/811.22.第27章一夜情Teevra Nishad N2 243/128可以从表1中收集八度音阶。例如, 第 十四世Shruti(P),Sa为3scin2。如果Sa是100赫兹,P就是150赫兹。根据给定的Raag,从22个Shrutis中选出7个,成为该Raag的7个Swara(也称为Sargam)。这七个Swaras的Komal(平)和Teevra(尖)变化被标记为{,,},类似于西方音乐的音符记谱法{,#,,#,#,A,A#,}。���������������此外,如前所述,Raag语法给出了表演者Shrutis可以演奏的信息。这种排列方式与西方的等律音阶(经常使用)相反,附近的半音的比例是恒定的,等于212-一个八度被分为12个半音[4]。一些特征提取过程可以用替代技术代替,例如STFT与CQT变换。在特征提取过程之后可以应用更多的平滑方法来改善表示的时间和音调稳定性。科学界在评估西方音乐方面取得了重大进展[5],研究人员创造了许多方法和技术[6然而,对印度音乐的科学贡献仍然有限[2],无法正确理解其复杂性。为此,我们提供Swaragram [10]的代码实现:1. 加载以标准音频格式给出的音乐文件并提取加载文件的Tonic2. 实现Swaragram功能及其底层组件。3. 对提取的特征进行标准归一化。4. 并且提供所提取的特征的可视化以用于视觉理解。2. 功能和主要特点Swaragram库是用Python编程语言实现的,并在GitHub上的GNU-GPLv 3许可下发布。2实现分为两个核心子模块(核心和实用程序),并使用良好的实践来保持它们的可管理性。核心子模块包含所需Swaragram函数的集合,并通过utils子模块提供帮助和包装器函数Python函数和描述如表2所示。用户可以在Github上获取默认参数和API的完整信息,并可以修改默认值以获得所需的参数效果。3. 影响概述Swaragram工具箱实现了Swaragram功能,支持专门用于印度音乐的功能。与Chromagram相反,Chromagram是一种广泛使用的频谱分析特征技术,用于分析音乐然而,在ICM中 Swaras(注释)的流体特性不能被2https://www.github.com/yeshwantsingh/swaragram。抓了这是因为Swaras的频率会根据演奏者选择的音乐音调而改变。 为了分析ICM,我们需要一个灵活的和流体的Chromagram类技术的基础上,紧张(Shadja)和微色调(Shrutis)。这是由Swaragram实现的。用于Raag分类/识别的印度音乐录音的音频处理和自动化是对在印度背景下检索音乐的重大贡献大多数Raag识别技术使用音高类分布,而其他则基于向量空间和旋律表面[17在西方音乐中,通常使用色度图对音频录音进行谐波分析(特别是旋律)在我们的观察中,ICM中色度功能的有效性我们使用Dunya数据集[20]进行了一个小实验,用于Raag识别。在以下出版物中针对几个特征进行了广泛的实验1. Y. Singh和A.Biswas,199,p.116879,2022 [21]。2. Y. Singh和A.Biswas,13. Y.辛格河,巴西-地Kumar和A.比斯瓦斯,比斯瓦斯E.Wennekes,T.P. 宏和A. Wieczorkowska,eds.),(新加坡),pp. 109与也是抽象和声音乐功能的chromagram相比,性能的提升是由于Swaragram的设计,它在计算给定录音的动态音阶时考虑了Tonic和Shruti。进一步区分这两个特征的视觉表示在图。1.一、图中显示了ICM性能示例的色度图和Swaragram图。音频样本是Raag Bhoopali的声乐表演,用调谐到A#4 = 440赫兹的Tanpura调谐。 图中的上图。1显示所选ICM音乐样本的色度图。几乎在任何地方,我们都能看到几个亮区。这些弱光区域是在垂直轴中Raag Bhoopali的语法[22]表明,一些Swaras是严禁在色度图中,我们看到几乎所有的发光区域的禁止Swaras(周围的A和,如果我们采取对应于西方符号的Swaras等回火标度)。相反,当我们观察给定ICM音乐样本的Swaragram图时,在图2的下图中。1,和Swaras,禁止在此Raag ,不存在的代表。它证明了Swaragram的有效性Raag Bhoopali只能使用Shudha Swaras和KomalSwaras在我们的情节中进行。它是由音乐家在给定的Chalan(音符的 进展 ) 中 使 用Alankars( 音 符) 如 Meend ( 滑 动) 引 起 的。Swaragram可能会进一步处理,以容忍音调和时间差异,并敦促其他人这样做表1频率号22只ShrutShrutimame的是.符号比号Shruti名字符号比1.沙贾S1/112.Teevra MadhyamM145/32Y.辛格湖,澳-地Waikhom和A. 比斯瓦斯软件影响15(2023)1004623表2Swaragram库的API描述。功能描述utils子模computeRefPitch它计算与给定音乐片段的Shadja(Tonic)相对应的Pitch值computeSTFT计算给定音乐片段的短期傅立叶变换(STFT)getTonic它计算给定音乐片段的Shadja(Tonic)loadAudio在给定路径加载音频样本logCompression它计算给 定 输 入 的Log压缩。铁芯模块swaraRange它根据Shurti音阶计算一个基音值的高频和低频poolMask它计算分配给给定音高的频率索引集。computeSwaragram它 计算给定STFT频谱图和Tonic值的Swaragram。logFreqSpec它计算对数尺度频率频谱图。plotSwaragram它有助于可视化Swaragram。4. 结论和进一步发展Fig. 1. ICM音频样本的色度图和Swaragram图。致谢我们已经介绍了Swaragram Python库,它提取Swaragram,这是一个受chromagram启发的功能,但专注于印度音乐。它是用Python标准实现的,还包括实用程序函数。Python库是免费许可的,允许其他专注于印度音乐的研究人员参与MIR。此外,我们将这种技术应用于古典印度音乐中,以识别Raag。其他人可以使用Swaragram Python库开发应用程序,并可以添加平滑技术,例如归一化以更好地容忍噪声和响度变化,或者添加新功能。对于未来的发展,Swaragram功能和工具箱可以更新,以在大型语料库中执行艺术家识别和歌曲匹配。另一增加的功能可以是将库与主音识别功能合并。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作这项工作得到了科学和工程委员会(SERB)、印度政府科学和技术部(DST)的支持,批准号为:ECR/2018/000204。引用[1]V.N. Bhatkhande,Hindustani Sangeet Paddhati(Marathi/Hindi),Vol. 1-4,Popular Prakashan,Mumbai,1995.[2]A.K.达塔,S.S.索兰基河森古普塔河,巴西-地查克拉博蒂湾Mahto,A.Patranabis,印度斯坦古典音乐的信号分析,Springer,2017。[3]D.S. Thakur,The notion of twenty-two shrutis,Resonance 20(6)(2015)515-531.[4]E.M. Burns,Intervals,Scales,and Tuning,in:The Psychology of Music,Elsevier,1999,pp. 215-264[5]H.R. Gudmundsdottir,Advances in music-reading research,Music Educ.Res.12(4)(2010)331-338.[6]M. Müller,Information Retrieval for Music and Motion,Vol. 2,Springer,2007。[7]D. Meredith,Computational Music Analysis,Vol. 62,Springer,2016.[8]M. Müller,音乐处理基础:音频,分析,算法,应用,Springer,2015。[9]M. 米 勒 , S 。 Ewert , Chroma toolbox : MATLAB implementations forextractingvariants of chroma based audio features,in:Proceedings of the 12thInternationalConference on Music Information Retrieval( ISMIR) ,2011. Hal-00727791,版本2- 2012年10月22日,Citeseer,2011年。Y.辛格湖,澳-地Waikhom和A. 比斯瓦斯软件影响15(2023)1004624[10] Y.辛格A. Biswas,基于Swaragram的残差神经架构,用于印度古典音乐中的raag识别,在:2021年第12届计算通信和网络技术国际会议,ICCCNT,IEEE,2021年,pp. 1比6[11] F. Korzeniowski,G. Widmer,用于和弦识别的特征学习:深度色度提取器,2016,arXiv预印本arXiv:1612.05065。[12] S. Ewert , M. Muller , P. Grosche , High resolution audio synchronizationusingchroma onset features , in : 2009 IEEE International Conference onAcoustics,Speech and Signal Processing,IEEE,2009,pp. 1869-1872年。[13] J.Serra , E. Herrera , X. Serra , Chroma binary similarity andlocalalignment applied to cover song identification , IEEE Trans.Audio SpeechLang. 过程16(6)(2008)1138[14] M.穆勒,F。库尔特,M。Clausen,用于音频匹配的基于色度的统计音频特征,在:IEEE信号处理应用于音频和声学研讨会,2005年,IEEE,2005年,pp. 275-278[15] G. Peeters,基于色度的音频信号分析音乐键的估计,在:ISMIR,2006年,pp.115-120[16] M.A. Bartsch,G.H.韦克菲尔德,流行音乐的音频缩略图使用基于色度的 表示,IEEE Trans. 多次。7(1)(2005)96[17] S. Gulati,J.Serrà Julià,K.K. Ganguli,S.森蒂尔克角Serra,用于ra'ga识别的时间延迟旋律表面,在:J。Devaney,M. 曼德尔D. Turnbull,G. Tzane-takis(编辑),ISMIR 2016. 第17届国际音乐信息检索会议论文集; 2016年8月7日至11日;纽约市(纽约州)。[加拿大]:ISMIR; 2016. P. 751-7,国际音乐信息检索学会(ISMIR),2016年。[18] S.古拉蒂, J.塞拉诉 伊什瓦 S.森蒂尔克, X.塞拉 基于短语 使用向量空间建模的rga识别,在:2016年IEEE声学,语音和信号处理国际会议,ICASSP,IEEE,2016年,pp. 66比70[19] P. Chordia , A. Rae , Raag recognition using pitch-class and pitch-classdyaddistributions,in:ISMIR,Citeseer,2007,pp. 431-436[20] MTG,Dunya:作为CompMusic项目的一部分开发的音乐语料库和相关软件工具,2021,URLhttps://dunya.compmusic.upf.edu/。[21] Y. 辛 格 A. Biswas , Robustness of musical features on deep learning modelsformusic genre classification,Expert Systems with Applications(ISSN:0957-4174)199(2022)116879。[22] Y.辛格河,巴西-地库马尔A. Biswas,Swaragram:印度古典音乐的Shruti-basedchromagram , in : A. 比 斯 瓦 斯 E. Wennekes, T. P. Hong , A. Wieczorkowska( Eds. ) , Advances in Speech and Music Technology , Springer Singapore ,2021,pp. 109比118
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功