用python把txt文件格式的NSL-KDD数据集进行one-hot编码并保存为csv文件
时间: 2023-05-26 13:04:04 浏览: 138
以下是用Python将txt格式的NSL-KDD数据集进行one-hot编码并保存为csv文件的示例代码:
```python
import pandas as pd
# 读取数据集文件
data = pd.read_csv('KDDTrain+.txt', header=None)
# 将数据集拆分为特征和标签
X = data.iloc[:, :-1]
y = data.iloc[:, -1]
# 对特征进行one-hot编码
X_one_hot = pd.get_dummies(X)
# 组合特征和标签,将数据保存为csv文件
X_one_hot['class'] = y
X_one_hot.to_csv('KDDTrain_one_hot.csv', index=False)
```
需要注意的是,此代码仅对训练集进行了处理。如果想要对测试集进行同样的处理,可以使用类似的代码:
```python
import pandas as pd
# 读取数据集文件
data = pd.read_csv('KDDTest+.txt', header=None)
# 将数据集拆分为特征和标签
X = data.iloc[:, :-1]
y = data.iloc[:, -1]
# 对特征进行one-hot编码
X_one_hot = pd.get_dummies(X)
# 组合特征和标签,将数据保存为csv文件
X_one_hot['class'] = y
X_one_hot.to_csv('KDDTest_one_hot.csv', index=False)
```
阅读全文