通过对特征向量进行训练,得到 SVM 分类器的步骤与代码
时间: 2024-03-06 08:46:21 浏览: 15
下面是使用 Python 和 scikit-learn 库训练 SVM 分类器的基本步骤和代码示例:
步骤1:导入必要的库
``` python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
```
步骤2:加载数据集并拆分为训练集和测试集
``` python
# 加载数据集
iris = datasets.load_iris()
X = iris.data[:, [2, 3]] # 选择两个特征
y = iris.target
# 拆分数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
```
步骤3:特征缩放
``` python
# 特征缩放,将特征缩放到相同的尺度
sc = StandardScaler()
sc.fit(X_train) # 计算训练集的均值和标准差
X_train_std = sc.transform(X_train) # 对训练集进行标准化
X_test_std = sc.transform(X_test) # 对测试集进行标准化
```
步骤4:训练 SVM 分类器
``` python
# 训练 SVM 分类器
svm = SVC(kernel='linear', C=1.0, random_state=0)
svm.fit(X_train_std, y_train)
```
步骤5:预测并评估模型
``` python
# 预测测试集的标签
y_pred = svm.predict(X_test_std)
# 计算分类器的准确率
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy: %.2f' % accuracy)
```
完整代码示例:
``` python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
# 加载数据集
iris = datasets.load_iris()
X = iris.data[:, [2, 3]] # 选择两个特征
y = iris.target
# 拆分数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
# 特征缩放,将特征缩放到相同的尺度
sc = StandardScaler()
sc.fit(X_train) # 计算训练集的均值和标准差
X_train_std = sc.transform(X_train) # 对训练集进行标准化
X_test_std = sc.transform(X_test) # 对测试集进行标准化
# 训练 SVM 分类器
svm = SVC(kernel='linear', C=1.0, random_state=0)
svm.fit(X_train_std, y_train)
# 预测测试集的标签
y_pred = svm.predict(X_test_std)
# 计算分类器的准确率
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy: %.2f' % accuracy)
```
以上代码中,我们使用了 iris 数据集,选择两个特征进行训练。首先,将数据集拆分为训练集和测试集,然后使用 StandardScaler 对数据进行标准化。接着,训练 SVM 分类器,并对测试集进行预测,最后计算分类器的准确率。