def formatData(X, y, i): # Format the MFCC data X_data = [] y_data = [] if i==0: # 12 features (MFCC) for sample, label in zip(X, y): features = extractFeatures(sample) mfcc = np.mean(features, axis=0).reshape((1, n_mfcc)) # mean X_data.append(mfcc) y_data.append(label) X_data = np.reshape(X_data, (-1, n_mfcc)) else: # 24 features (MFCC + variance) for sample, label in zip(X, y): features = extractFeatures(sample) mfcc = np.mean(features, axis=0).reshape((1, n_mfcc)) # mean var = np.var(features, axis=0).reshape((1, n_mfcc)) # added variance X_data.append(np.hstack((mfcc, var))) y_data.append(label) X_data = np.reshape(X_data, (-1, 2*n_mfcc)) return np.array(X_data), np.array(y_data)
时间: 2024-03-11 14:45:21 浏览: 85
MFCC.zip_MFCC_mfcc java实现
这段代码是一个数据预处理函数,用于将原始的音频数据转换为可以用于机器学习模型训练的数据格式。具体含义如下:
- `X`:输入数据,包括MFCC特征。
- `y`:标签数据,包括各个音频文件所属的乐器类别。
- `i`:选择特征数量的标志位,如果为0则只使用MFCC的平均值,如果为1则使用MFCC的平均值和方差。
下面是函数的具体实现:
1. 遍历所有输入样本,处理每个样本的MFCC特征。
2. 对于每个样本,提取MFCC特征并计算其平均值或平均值和方差。
3. 将处理后的数据添加到`X_data`和`y_data`中。
4. 根据标志位`i`的不同,将`X_data`格式化为12个MFCC特征或者24个MFCC特征和方差。
5. 返回格式化后的`X_data`和`y_data`。
这个函数是一个非常重要的预处理步骤,可以将原始的音频数据转换为可用于机器学习的格式。在这个函数中,使用了`extractFeatures`函数提取MFCC特征,并使用`numpy`库计算平均值和方差。最终得到的数据格式可以直接用于训练和评估机器学习模型。
阅读全文