首页用python把txt文件格式的NSL-KDD数据集进行one-hot编码并保存为csv文件

用python把txt文件格式的NSL-KDD数据集进行one-hot编码并保存为csv文件

时间: 2023-05-26 13:04:04 浏览: 138

以下是用Python将txt格式的NSL-KDD数据集进行one-hot编码并保存为csv文件的示例代码： ```python import pandas as pd # 读取数据集文件 data = pd.read_csv('KDDTrain+.txt', header=None) # 将数据集拆分为特征和标签 X = data.iloc[:, :-1] y = data.iloc[:, -1] # 对特征进行one-hot编码 X_one_hot = pd.get_dummies(X) # 组合特征和标签，将数据保存为csv文件 X_one_hot['class'] = y X_one_hot.to_csv('KDDTrain_one_hot.csv', index=False) ``` 需要注意的是，此代码仅对训练集进行了处理。如果想要对测试集进行同样的处理，可以使用类似的代码： ```python import pandas as pd # 读取数据集文件 data = pd.read_csv('KDDTest+.txt', header=None) # 将数据集拆分为特征和标签 X = data.iloc[:, :-1] y = data.iloc[:, -1] # 对特征进行one-hot编码 X_one_hot = pd.get_dummies(X) # 组合特征和标签，将数据保存为csv文件 X_one_hot['class'] = y X_one_hot.to_csv('KDDTest_one_hot.csv', index=False) ```

阅读全文