DCASE 2019冠军解决方案：城市声音标记技术深度解析

需积分: 13 56 浏览量更新于2024-11-24 收藏 35KB ZIP 举报

DCASE (Detection and Classification of Acoustic Scenes and Events) 是一个国际性的学术挑战，专注于声学场景和事件的检测与分类。2019年的DCASE挑战赛中，任务5专注于城市声音标记，即为一段城市环境中的声音片段分配相应的标签。本存储库包含了获得该任务第一名的解决方案的相关代码和数据处理流程。首先，解决方案的运行环境要求包括： - 操作系统：基于Linux的系统； - Python版本：Python 3.5或更高； - 硬件：拥有至少8GB内存的NVidia GPU图形卡； - CUDA：CUDA 10.0或更高版本； - 软件包：已安装virtualenv。解决方案的复制与执行步骤如下： 1. 使用`git clone`命令克隆存储库到本地； 2. 进入存储库目录； 3. 执行`make run_all`命令，这个命令会依次执行后续的各个make任务。 `make run_all`命令执行的具体步骤包括： - `make env`：创建一个虚拟环境，这是一个常用的做法，可以隔离项目的依赖环境，避免对系统环境造成污染； - `make reqs`：安装所需的Python软件包，这些包是运行模型和处理数据所必需的； - `make pytorch`：安装PyTorch框架，PyTorch是一个广泛使用的深度学习框架，本解决方案显然是采用PyTorch来构建深度学习模型的； - `make download`：从Zenodo（一个学术文件共享平台）下载任务5的相关数据，这些数据是声音文件及其对应的标签； - `make extract`：提取下载的压缩文件，这可能包括解压声音文件和标签文件； - `make parse`：解析注释，可能涉及到解析声音文件的元数据或其他相关信息； - `make logmel`：计算并保存所有文件的Log-Mel频率，这是一种特征提取方法，常用于声音信号处理，能够将声音信号转换成适用于机器学习模型训练的数值形式。该解决方案的标签包括：deep-learning（深度学习）、audio-classification（音频分类）、dcase（DCASE挑战赛）、dcase2019（2019年的DCASE挑战赛）、Python。这些标签指明了该解决方案的技术领域、应用场景以及使用的主要编程语言。从存储库的文件名称来看，文件名称为`dcase2019-task5-urban-sound-tagging-master`，这意味着该项目是一个主分支版本，可能包含了完整的功能和最新的更新。该存储库中的代码和数据处理流程为城市声音分类提供了一个领先的方法论，通过细致的步骤说明了如何从数据准备到模型训练再到结果预测的过程，为后续研究者提供了宝贵的参考。通过该解决方案，研究者和工程师可以更好地理解如何使用深度学习技术来处理和分析复杂的城市环境声音数据，进一步推动声音识别和分类技术的发展。

资源目录

收起资源包目录

DCASE 2019冠军解决方案：城市声音标记技术深度解析（22个子文件）

metrics.py 28KB

03-train-system-1.py 6KB

utils.py 3KB

README.md 70B

09-generate-submission-system-1.py 4KB

LICENSE 1KB

classify.py 20KB

evaluate_predictions.py 2KB

RandomErasing.py 2KB

calc_num_trainable_params.py 411B

README.md 3KB

extract_embedding.py 6KB

04-generate-valid-set-preds-system-1.py 3KB

06-scale-annos-system-2.py 2KB

requirements.txt 478B

Makefile 2KB

10-generate-submission-system-2.py 4KB

08-generate-valid-set-preds-system-2.py 3KB

.gitignore 43B

07-train-system-2.py 5KB

02-compute-log-mel.py 1KB

01-parse-annotations.py 3KB

共 22 条

HMI前线

粉丝: 23

DCASE 2019冠军解决方案：城市声音标记技术深度解析

DCASE2020-Task6-PKU:北大团队对DCASE2020 Task6的Pytorch实施

Baseline-MATLAB-DCASE:此存储库包含 DCASE2021 任务 1A 基线代码的非官方 MATLAB 实现，这是 DCASE 挑战的一部分。-matlab开发

DCASE2019_Task2数据集

DCASE2019数据集

conda install albumentations

有没有带声音距离标签的声音数据集？

dcase给的基线系统怎么运行

util.dataset

PaSST transformer

在哪个配置文件设置

最新资源