根据path = r'data/1HP',编写一个滚动轴承数据集预处理代码,包含打上标签,one-hot编码以及归一化处理,并转换成np格式
时间: 2024-03-27 13:40:09 浏览: 129
好的,以下是基于Python和numpy的滚动轴承数据集预处理代码,包含打上标签,one-hot编码以及归一化处理,并转换成np格式:
```python
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder, OneHotEncoder, MinMaxScaler
# 定义数据集路径
path = r'data/1HP'
# 定义标签字典
label_dict = {'NORMAL': 0, 'IR': 1, 'OR': 2}
# 读取数据集
data = pd.read_csv(path, header=None)
# 打上标签
data[0] = data[0].apply(lambda x: label_dict[x])
# one-hot编码
enc = OneHotEncoder(sparse=False)
one_hot = enc.fit_transform(data.iloc[:, 0].values.reshape(-1, 1))
data = pd.concat([data, pd.DataFrame(one_hot)], axis=1)
data.drop(0, inplace=True, axis=1)
# 归一化处理
scaler = MinMaxScaler()
data.iloc[:, :-3] = scaler.fit_transform(data.iloc[:, :-3].values)
# 转换成numpy格式
data = np.array(data.values, dtype=np.float32)
```
以上代码将滚动轴承数据集进行了预处理,包含了标签打上、one-hot编码和归一化处理,并将处理后的数据集转换成了numpy格式。最终得到的数据集可以用于训练深度学习模型。
阅读全文