采用 scikit-learn 中的线性 SVM 对 iris 数据集进行二分类,输出决策边界的参数和截距、支持向量并通过散点图可视化数据样本(之前选择的两个特征),并画出决策边界和 2 个最大间隔边界,标出支持向量
时间: 2024-02-10 20:10:55 浏览: 25
好的,我来为您解答这个问题。
首先,我们需要导入 iris 数据集和 scikit-learn 中的 svm 模块:
```python
from sklearn import datasets
from sklearn.svm import SVC
import matplotlib.pyplot as plt
import numpy as np
iris = datasets.load_iris()
X = iris.data[:, :2] # 只使用前两个特征
y = iris.target
```
然后,我们可以使用 SVM 模型进行训练和预测,并输出决策边界的参数和截距、支持向量:
```python
clf = SVC(kernel='linear', C=1.0)
clf.fit(X, y)
# 输出决策边界的参数和截距
print("Coefficients:", clf.coef_)
print("Intercept:", clf.intercept_)
# 输出支持向量
support_vectors = clf.support_vectors_
print("Support Vectors:", support_vectors)
```
最后,我们可以将数据集和决策边界可视化:
```python
# 绘制数据样本散点图
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.coolwarm)
# 绘制决策边界和边界上的点
ax = plt.gca()
xlim = ax.get_xlim()
ylim = ax.get_ylim()
# 创建网格来评估模型
xx = np.linspace(xlim[0], xlim[1], 30)
yy = np.linspace(ylim[0], ylim[1], 30)
YY, XX = np.meshgrid(yy, xx)
xy = np.vstack([XX.ravel(), YY.ravel()]).T
Z = clf.decision_function(xy).reshape(XX.shape)
# 绘制决策边界和边界上的点
ax.contour(XX, YY, Z, colors='k', levels=[-1, 0, 1], alpha=0.5, linestyles=['--', '-', '--'])
ax.scatter(support_vectors[:, 0], support_vectors[:, 1], s=100, linewidth=1, facecolors='none', edgecolors='k')
# 绘制两个最大间隔边界
ax.plot([clf.coef_[0][0]*xlim[0]+clf.coef_[0][1]*ylim[0]+clf.intercept_[0], clf.coef_[0][0]*xlim[1]+clf.coef_[0][1]*ylim[1]+clf.intercept_[0]],
[clf.coef_[0][0]*xlim[1]+clf.coef_[0][1]*ylim[1]+clf.intercept_[0], clf.coef_[1][0]*xlim[1]+clf.coef_[1][1]*ylim[1]+clf.intercept_[1]],
'k--', lw=2)
ax.plot([clf.coef_[0][0]*xlim[0]+clf.coef_[0][1]*ylim[0]+clf.intercept_[0], clf.coef_[1][0]*xlim[0]+clf.coef_[1][1]*ylim[0]+clf.intercept_[1]],
[clf.coef_[1][0]*xlim[0]+clf.coef_[1][1]*ylim[0]+clf.intercept_[1], clf.coef_[0][0]*xlim[1]+clf.coef_[0][1]*ylim[1]+clf.intercept_[0]],
'k--', lw=2)
# 设置坐标轴和标题
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.xlim(xlim)
plt.ylim(ylim)
plt.title('SVM for iris dataset')
# 显示图形
plt.show()
```
运行以上代码,即可得到决策边界和支持向量的可视化结果。