语音活动检测多源数据集汇总与应用介绍

版权申诉

154 浏览量更新于2024-09-27 收藏 137.68MB ZIP 举报

资源摘要信息:"该资源是一个与语音活动检测相关的数据集，包含从不同音频数据库中采集的719个音频样本。数据集的核心目的是用于训练和测试语音活动检测算法，即区分出音频信号中的人类语音和其他类型声音（例如沉默和噪声）。语音活动检测是语音相关技术领域的基础任务，对于许多应用来说至关重要，如语音编码、语音识别和语音增强等。语音活动检测技术是通过自动识别和分割出音频流中包含人类语音的片段，以及非语音片段，如背景噪声或沉默。准确地进行语音活动检测对于提升语音处理系统性能至关重要，因为它可以减少后续处理步骤中的计算负担，并改善声音质量。该数据集由三个主要的音频数据库组成： 1. TIMIT数据库：TIMIT是一个包含大量标准的美式英语发音的数据库，由麻省理工学院、斯坦福研究学院、德州仪器公司和SRI国际公司联合开发。该数据库包含630位说话人的8452个句子，每个说话人包含10个句子，分别在8个不同的方言区域录制。TIMIT被广泛用于语音识别技术的研究，尤其在声学模型和语音识别系统的性能评估方面。 2. PTDB-TUG数据库：该数据库是一个为音高跟踪任务设计的语音数据库。它包含20位不同的英语母语者（10位男性和10位女性）的录音。每个说话者都读出了相同的文本，使用多个麦克风在不同的录音条件下进行采集，这使得PTDB-TUG非常适合声学特征的深入研究和开发。 3. Noize-Us数据库：Noize-Us是一个专门用于噪声环境下语音识别研究的数据库。它包含了30个句子的语音数据，这些句子被胡言乱语(人群)、街道、火车、火车站、汽车和餐馆等不同类型的背景噪音所破坏。这些噪音与语音信号混合在一起，信噪比(SNR)被设定为5分贝，这为评估和改进在低信噪比环境下的语音识别算法提供了非常实际的测试条件。数据集的标签“数据集语音识别深度学习检测”揭示了该资源的用途和应用场景。这些标签指向了数据集被设计用于训练机器学习模型，尤其是深度学习模型，来执行语音识别任务中的语音活动检测。深度学习在语音处理领域已经成为一种强大且广泛使用的技术，特别是在处理复杂模式识别任务时，如语音活动检测。最后，“压缩包子文件的文件名称列表: Data”表明该数据集可能以压缩形式存储在一个名为“Data”的文件中，需要解压缩后才能使用。考虑到数据集的大小和内容的多样性，预处理和组织良好的数据可以极大地简化机器学习工程师和研究人员的工作流程。"

收起资源包目录

和语音活动检测相关的数据集（1438个子文件）

mic_M01_si459.TextGrid 2KB

SX333.TextGrid 2KB

SX38.TextGrid 2KB

mic_F06_si1485.TextGrid 2KB

SX428.TextGrid 2KB

SX350.TextGrid 2KB

SI1339.TextGrid 2KB

mic_F02_si654.TextGrid 2KB

mic_F03_si903.TextGrid 2KB

SX442.TextGrid 2KB

mic_F03_si864.TextGrid 2KB

SI1335.TextGrid 2KB

sp21_restaurant_sn5.TextGrid 2KB

SI1208.TextGrid 2KB

mic_F04_sx147.TextGrid 2KB

sp19_car_sn5.TextGrid 2KB

SX128.TextGrid 2KB

mic_M05_si1257.TextGrid 3KB

SI620.TextGrid 2KB

SX444.TextGrid 2KB

SX135.TextGrid 2KB

SI1747.TextGrid 2KB

SX433.TextGrid 2KB

mic_M07_sx311.TextGrid 2KB

sp21_street_sn5.TextGrid 2KB

mic_F03_si963.TextGrid 2KB

mic_M01_si635.TextGrid 2KB

sp19_station_sn5.TextGrid 2KB

mic_F08_si1820.TextGrid 2KB

mic_F08_sx362.TextGrid 2KB

SI624.TextGrid 2KB

SX431.TextGrid 2KB

SI1840.TextGrid 2KB

mic_M09_si2064.TextGrid 2KB

SX172.TextGrid 2KB

mic_F08_si1791.TextGrid 2KB

mic_M04_si1180.TextGrid 2KB

SI1241.TextGrid 3KB

SX366.TextGrid 2KB

SX321.TextGrid 2KB

SX366.TextGrid 2KB

SX387.TextGrid 2KB

SI1920.TextGrid 2KB

sp21.TextGrid 2KB

SX315.TextGrid 2KB

SX147.TextGrid 2KB

SX153.TextGrid 2KB

SX401.TextGrid 2KB

mic_M05_si1232.TextGrid 2KB

mic_M04_si1041.TextGrid 2KB

mic_M04_sx170.TextGrid 2KB

sp21_car_sn5.TextGrid 2KB

SX88.TextGrid 2KB

sp19_street_sn5.TextGrid 2KB

mic_F03_si892.TextGrid 2KB

SI1880.TextGrid 2KB

mic_M05_si1392.TextGrid 2KB

mic_M03_si1011.TextGrid 2KB

mic_F04_si1206.TextGrid 2KB

SX340.TextGrid 2KB

mic_M07_si1757.TextGrid 2KB

SI990.TextGrid 2KB

sp21_babble_sn5.TextGrid 2KB

SI1782.TextGrid 2KB

mic_M05_si1302.TextGrid 2KB

SX174.TextGrid 2KB

SX84.TextGrid 2KB

SX161.TextGrid 2KB

SX41.TextGrid 2KB

mic_F06_si1444.TextGrid 2KB

mic_F03_si985.TextGrid 2KB

SX251.TextGrid 2KB

mic_M05_si1240.TextGrid 2KB

sp19.TextGrid 2KB

SI679.TextGrid 2KB

mic_F02_si675.TextGrid 2KB

SI532.TextGrid 2KB

sp21_train_sn5.TextGrid 2KB

SX440.TextGrid 2KB

mic_F04_si1097.TextGrid 2KB

SI808.TextGrid 2KB

SI1115.TextGrid 2KB

SI1160.TextGrid 2KB

sp21_station_sn5.TextGrid 2KB

sp19_babble_sn5.TextGrid 2KB

SX181.TextGrid 2KB

mic_F09_si2009.TextGrid 2KB

mic_M09_si1970.TextGrid 2KB

SX417.TextGrid 2KB

SX430.TextGrid 2KB

SI960.TextGrid 2KB

SI841.TextGrid 2KB

mic_F09_sx407.TextGrid 2KB

SX450.TextGrid 2KB

SI1792.TextGrid 2KB

sp19_restaurant_sn5.TextGrid 2KB

mic_M06_si1452.TextGrid 2KB

sp19_train_sn5.TextGrid 2KB

mic_M09_si2046.TextGrid 2KB

SX260.TextGrid 2KB

共 1438 条

地理探险家

粉丝: 1236
资源: 5535

语音活动检测多源数据集汇总与应用介绍

语音活动检测数据集.zip

语音年龄识别的数据集文件

python语音模式检测内含数据集以及源码

AudioMLProject1:语音活动检测

Ethos-Hate-Speech-Dataset:该存储库包含用于社交媒体平台上的仇恨语音检测的数据集

基于线性预测共振峰检测和基音参数的语音合成实验（内涵数据集以及源码）

语音检测-基于深度神经网络在嘈杂环境中实现实时的语音活动检测-优质项目实战.zip

基于深度学习的语音模拟（语音克隆）内含数据集.zip

火焰检测数据集 目标检测

语音情绪识别中文情感数据集

最新资源

火焰检测数据集目标检测