librosa.feature.chroma_cqt参数
时间: 2023-05-14 12:04:17 浏览: 162
librosa.feature.chroma_cqt函数的参数是:
- y:音频信号
- sr:采样率
- hop_length:帧移
- fmin:最低频率
- n_chroma:色度数
- norm:是否进行归一化
- threshold:阈值
该函数用于计算音频信号的色度图谱,其中色度数指的是12个半音。
相关问题
librosa.feature.chroma_stft()怎么用
librosa.feature.chroma_stft() 函数用于计算音频信号的色度图(chromagram),即将每个音调在12个半音中的位置表示为一个向量。使用该函数需要先导入Librosa库,下面是该函数的用法:
```python
import librosa
y, sr = librosa.load('audio_file.wav')
chromagram = librosa.feature.chroma_stft(y=y, sr=sr)
```
其中,`y` 是音频信号,`sr` 是采样率,`chromagram` 是一个 12 x n 的矩阵,每一列代表音频信号的一个时间段上的色度向量。你也可以通过参数改变帧长、帧移、调整参考音高等来获取不同的色度图。
librosa.feature.chroma_stft()函数怎么用
`librosa.feature.chroma_stft()`函数用于计算音频信号的频率特征表示,该函数的用法如下:
```python
chroma_stft = librosa.feature.chroma_stft(y=y, sr=sr)
```
其中,`y`是音频数据,`sr`是采样率。`chroma_stft`是计算得到的频率特征表示。如果不指定`y`和`sr`,则会使用默认值。
该函数的详细参数说明如下:
- `y`: 音频时间序列数据,类型为`numpy.ndarray`,默认为`None`。
- `sr`: 音频采样率,类型为`int`,默认为`22050`。
- `S`: 短时傅里叶变换(STFT)结果,类型为`numpy.ndarray`,默认为`None`。
- `norm`: 是否对每个帧进行归一化,类型为`bool`,默认为`True`。
- `n_fft`: STFT窗口大小,类型为`int`,默认为`2048`。
- `hop_length`: STFT窗口的跳跃长度,类型为`int`,默认为`512`。
- `A440`: 用于计算音符名称的参考频率,类型为`float`,默认为`440.0`。
函数的返回值是一个大小为`(n_chroma, T)`的`numpy.ndarray`,其中`n_chroma`为音高数目(默认为12,即12个半音),`T`为帧数。
阅读全文