使用pytorch编写风速数据预处理代码
时间: 2023-05-29 22:08:00 浏览: 139
以下是一个简单的风速数据预处理代码示例,使用PyTorch:
```
import torch
import numpy as np
import pandas as pd
# 读取风速数据
data = pd.read_csv('wind_speed.csv')
# 将数据转换为PyTorch张量
data_tensor = torch.from_numpy(data.values).float()
# 数据归一化
data_tensor = (data_tensor - data_tensor.min()) / (data_tensor.max() - data_tensor.min())
# 分离输入和输出
input_data = data_tensor[:, :-1]
output_data = data_tensor[:, -1:]
# 打乱数据
shuffle_indices = torch.randperm(input_data.shape[0])
input_data = input_data[shuffle_indices]
output_data = output_data[shuffle_indices]
# 分割数据集
train_size = int(0.8 * input_data.shape[0])
train_input, test_input = input_data[:train_size], input_data[train_size:]
train_output, test_output = output_data[:train_size], output_data[train_size:]
# 将数据集分批
batch_size = 32
train_dataset = torch.utils.data.TensorDataset(train_input, train_output)
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
test_dataset = torch.utils.data.TensorDataset(test_input, test_output)
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=batch_size, shuffle=True)
# 打印数据集的大小
print(f"训练集大小:{len(train_dataset)}, 测试集大小:{len(test_dataset)}")
```
这个代码片段将数据读入一个Pandas DataFrame中,将其转换为一个PyTorch张量,对数据进行归一化处理,分离输入和输出,打乱数据集,分割数据集,并将其分成批次。最后,打印出数据集的大小,以确保数据已正确加载。
阅读全文