PyTorch实现1D-Triplet-CNN模型：音频信号说话人识别

需积分: 15 106 浏览量更新于2024-11-08 1 收藏 3.61MB ZIP 举报

资源摘要信息:"lpcmatlab代码-1D-Triplet-CNN是关于一维三重神经网络模型的PyTorch实现，由A.Chowdhury和A.Ross在研究中进行了描述。研究文章发表在《IEEE信息取证与安全交易》（2019年）。该模型是使用Python 3.6在PyTorch 1.2.1中实现的，可能与PyTorch和Python的不同版本兼容。模型的源代码和预训练模型分别位于子目录中。数据集是根据从获得的Fisher语言语料库的子集进行训练的，训练数据也因从数据集获得的不同程度的Babble噪声而退化。" 知识点： 1. LPC（线性预测编码）：LPC是一种声音信号处理技术，它通过线性预测模型来估计当前样本值，从而有效地压缩音频信号。 2. MFCC（梅尔频率倒谱系数）：MFCC是一种用于语音处理的特征提取技术，它可以将信号转换为梅尔刻度上的频率，并计算倒谱以提取语音特征。 3. 三重态神经网络（Triplet Network）：三重态神经网络是一种深度学习模型，主要用于学习特征嵌入，它包含三个输入，分别为一个锚点、一个正样本和一个负样本。其目的是使锚点和正样本之间的距离小于锚点和负样本之间的距离。 4. PyTorch：PyTorch是一个开源的机器学习库，基于Python编程语言，用于自然语言处理和计算机视觉等任务。PyTorch 1.2.1是其一个版本。 5. 说话人识别：说话人识别是一种技术，用于识别音频信号中的特定说话人。它在许多应用中都非常重要，如安全验证、个性化服务等。 6. 严重降级的音频信号：严重降级的音频信号是指由于各种原因（如噪声、干扰等）而导致音质严重下降的音频信号。 7. Babble噪声：Babble噪声是一种常见的噪声类型，它模拟了多人交谈的背景噪声。在语音识别和说话人识别中，Babble噪声是一个常见的挑战。 8. Fisher语言语料库：Fisher语言语料库是基于真实对话的语音数据集，被广泛用于说话人识别和语音识别的研究。 9. Python 3.6：Python 3.6是Python编程语言的一个版本，具有许多新特性，包括异步编程、新的格式化方法等。 10. 1D-Triplet-CNN模型：1D-Triplet-CNN模型是一种使用1D三重态CNN融合MFCC和LPC功能的一维三重神经网络模型，用于对严重降级的音频信号中的说话人进行识别。

收起资源包目录

lpcmatlab代码-1D-Triplet-CNN:1D-Triplet-CNN神经网络模型的PyTorch实现在A.Chowdhury和A （32个子文件）

sigproc.py 18KB

._.DS_Store 4KB

Feature_fusion.png 782KB

2.wav 78KB

._lpcc.m 4KB

README.md 3KB

._lpcc.m 4KB

._.DS_Store 4KB

LICENSE 1KB

OneD_Triplet_CNN.cpython-37.pyc 2KB

17.mat 103KB

get_LPC_MFC_feature.m 1003B

1.wav 78KB

17.wav 78KB

extractFeatures.m 2KB

OneD_Triplet_CNN.py 2KB

arch.png 1.38MB

oned_triplet_cnn.pth.tar 1.04MB

22.mat 135KB

lpcc.m 4KB

.DS_Store 6KB

test.py 3KB

requirements.txt 688B

1.wav 78KB

22.wav 78KB

12.mat 107KB

._README.md 4KB

12.wav 78KB

.DS_Store 6KB

1.mat 95KB

lpcc.m 5KB

._get_LPC_MFC_feature.m 4KB

共 32 条

weixin_38618784

粉丝: 11
资源: 884

PyTorch实现1D-Triplet-CNN模型：音频信号说话人识别

pytorch中nn.Conv1d的用法详解

ProtectiveBehaviourRecognition:Emopain数据集

基于MATLAB的CNN测试例子

triplet-loss-pytorch:高效的PyTorch版本的Semi-hard Triplet loss:high_voltage:

Pytorch-Triplet_loss:用Pytorch实现三重损失

facenet-pytorch-master.zip

PyPI 官网下载 | facenet-pytorch-2.2.8.tar.gz

matlab终止以下代码-vehicle-triplet:用于Veri776和VehicleID的三重模型火车

Person_reID_baseline_pytorch-master.zip_Person Re-ID:_PyTorch行人识

Python库 | pytorch-metric-learning-0.9.87.dev0.tar.gz

最新资源