读取new_training_set、new_test_set和new_pred_set中的数据并删除时间列,转换为pytorch张量,将时间列添加回第一列
时间: 2023-08-12 20:32:24 浏览: 137
pytorch训练数据
假设数据集是以csv格式存储的,可以使用pandas库来读取和操作数据。以下是读取数据集、删除时间列、转换为PyTorch张量、并添加时间列的代码:
```python
import pandas as pd
import torch
# 读取训练集、测试集和预测集
train_df = pd.read_csv('new_training_set.csv')
test_df = pd.read_csv('new_test_set.csv')
pred_df = pd.read_csv('new_pred_set.csv')
# 删除时间列
train_df = train_df.drop(columns=['时间'])
test_df = test_df.drop(columns=['时间'])
pred_df = pred_df.drop(columns=['时间'])
# 将数据转换为PyTorch张量
train_tensor = torch.tensor(train_df.values).float()
test_tensor = torch.tensor(test_df.values).float()
pred_tensor = torch.tensor(pred_df.values).float()
# 添加时间列
train_tensor = torch.cat([torch.arange(train_tensor.shape[0]).unsqueeze(1), train_tensor], dim=1)
test_tensor = torch.cat([torch.arange(test_tensor.shape[0]).unsqueeze(1), test_tensor], dim=1)
pred_tensor = torch.cat([torch.arange(pred_tensor.shape[0]).unsqueeze(1), pred_tensor], dim=1)
```
这里假设时间列的名称为"时间",可以根据实际情况进行修改。经过以上步骤,训练集、测试集和预测集都被转换为了PyTorch张量,且时间列被添加回了第一列。
阅读全文