基于pytorch的unsw-nb15数据集的训练集测试集合并并对数据集预处理之后用svm训练测试代码
时间: 2024-02-24 14:54:40 浏览: 161
爬虫代码,数据集寻找加自动分类,训练集,测试集自动生成!下载就可用,python
好的,我可以为您提供基于PyTorch的UNSW-NB15数据集的训练集和测试集合并以及数据预处理后使用SVM进行训练和测试的代码。以下是代码示例:
```python
import numpy as np
import pandas as pd
from sklearn import svm
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
# 加载数据集
data = pd.read_csv('UNSW_NB15_training-set.csv')
# 特征选择(选择前10个特征)
features = ['srcip', 'sport', 'dstip', 'dsport', 'proto', 'state', 'dur', 'sbytes', 'dbytes', 'sttl']
X = data[features]
y = data['label']
# 数据预处理(标准化)
scaler = StandardScaler()
X = scaler.fit_transform(X)
# 训练集测试集划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# SVM训练和测试
clf = svm.SVC(kernel='linear')
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
# 输出准确率
acc = np.mean(y_pred == y_test)
print('Accuracy:', acc)
```
上述代码中,首先我们使用Pandas库加载UNSW_NB15_training-set.csv数据集。然后我们选择前10个特征作为模型输入特征,并将标签设置为y。接着我们使用StandardScaler对X进行标准化处理。然后我们使用train_test_split函数将数据集划分为训练集和测试集。最后我们使用SVM进行训练和测试,并输出准确率。
希望这个例子可以帮助您完成您的项目!
阅读全文