GBDT的将时间序列的电压数据预处理:将数据集按时间先后顺序排序,并拆分为训练集和测试集的代码
时间: 2024-05-03 16:22:42 浏览: 182
假设电压数据集为一个包含时间戳和电压值的二维数组,代码如下:
```python
import numpy as np
# 电压数据集
voltage_data = np.array([
[1587100000, 220],
[1587100060, 221],
[1587100120, 222],
[1587100180, 223],
[1587100240, 224],
[1587100300, 225],
[1587100360, 226],
[1587100420, 227],
[1587100480, 228],
[1587100540, 229],
[1587100600, 230],
[1587100660, 231],
[1587100720, 232],
[1587100780, 233],
[1587100840, 234],
[1587100900, 235],
[1587100960, 236],
[1587101020, 237],
[1587101080, 238],
[1587101140, 239],
[1587101200, 240],
[1587101260, 241],
[1587101320, 242],
[1587101380, 243]
])
# 按时间先后顺序排序
voltage_data = voltage_data[np.argsort(voltage_data[:, 0])]
# 拆分为训练集和测试集
train_data = voltage_data[:15, :]
test_data = voltage_data[15:, :]
```
首先,我们使用`np.argsort()`函数按第一列(即时间戳)的大小排序,得到按时间先后顺序排列的电压数据集。然后,我们将数据集拆分为训练集和测试集,前15个数据样本作为训练集,后面的8个数据样本作为测试集。
阅读全文