air_data = (air_data - air_data.mean(axis = 0)) / (air_data.std(axis = 0))
时间: 2024-05-31 09:13:17 浏览: 84
这段代码是对变量 air_data 进行标准化处理,使其每列数据的均值为 0,标准差为 1。具体来说,代码中的 air_data.mean(axis=0) 计算出 air_data 中每列数据的平均值,而 air_data.std(axis=0) 则计算每列数据的标准差。然后,用原数据减去平均值,再除以标准差,就可以得到标准化后的数据。这种处理可以帮助我们消除数据间的量纲差异,使得不同变量之间可以更好地比较和分析。
相关问题
def map_data(data_map, axis_num): data_map = np.max(data_map, axis=axis_num) data_map -= data_map.min() data_map = data_map / data_map.max() data_map = np.array(data_map * 255, dtype=np.uint8) return data_map Eigon实现
以下是Eigen实现:
```
#include <iostream>
#include <Eigen/Dense>
using namespace Eigen;
using namespace std;
MatrixXi map_data(MatrixXi data_map, int axis_num) {
int height = data_map.rows();
int width = data_map.cols();
// reduce the data_map along the given axis_num
VectorXi max_vals(width);
if (axis_num == 0) {
max_vals = data_map.rowwise().maxCoeff();
} else if (axis_num == 1) {
max_vals = data_map.colwise().maxCoeff();
}
// normalize the result
int min_val = max_vals.minCoeff();
int max_val = max_vals.maxCoeff();
MatrixXi result = (data_map.array() - min_val) * 255 / (max_val - min_val);
return result;
}
int main() {
// example usage
MatrixXi data_map(3, 3);
data_map << 1, 2, 3,
4, 5, 6,
7, 8, 9;
MatrixXi result = map_data(data_map, 0);
cout << result << endl;
return 0;
}
```
需要注意的是,Eigen中的Matrix类模板参数中有两个参数,第一个参数是矩阵元素的类型,第二个参数是矩阵的行数和列数,用RowMajor表示按行存储,用ColMajor表示按列存储。在这个实现中,我们用MatrixXi表示矩阵元素为整型,且按列存储。
y = data['血糖']data = data.drop(columns=['血糖'])# 归一化mean = train.mean(axis=0)std = train.std(axis=0)train = (train - mean) / stdtest = (test - mean) / std# 执行PCA降维pca = PCA(n_components=10)train = pca.fit_transform(train)test = pca.transform(test)input_dim = 10 # 降维后的输入特征维度time_steps = 60output_steps = 1 # 可以预测一步,或预测多步#target_index = data.columns.tolist().index('血糖') # 待预测变量是第几个特征class MyDataset(Dataset): def __init__(self, data, label, time_steps, output_steps, target_index): # 新增label参数 self.time_steps = time_steps self.output_steps = output_steps self.target_index = target_index self.data = self.transform(data.astype(np.float32)) self.label = label # 定义self.label def transform(self, data): output = [] for i in range(data.shape[0] - self.time_steps - self.output_steps): output.append(data[i: (i + self.time_steps + self.output_steps), :]) return np.stack(output) def __getitem__(self, index): data = self.data[index, 0:self.time_steps, :] label = self.label[index + self.time_steps] # 注意,这里改为预测一步之后的标签的运算过程
这段代码定义了一个自定义数据集 MyDataset,用于将数据转换成模型输入所需的格式。它接收包括所有特征在内的数据和标签,以及时间步数 time_steps 和输出步数 output_steps,用于将数据转换成模型需要的形式。在 __init__ 函数中,将传入的数据转换成 float32 类型并进行归一化处理。在 transform 函数中,将数据按照 time_steps 和 output_steps 划分成多个小块,并将这些小块组合成一个三维数组。在 __getitem__ 函数中,根据索引获取对应的数据和标签,并将标签改为预测一步之后的标签。注意,这里的 target_index 已经不再需要了,因为目标变量已经在 data 中被删除了。
阅读全文