Iris数据集一共包含150个样本,分为3类,每类50个数据,每个数据包含4个属性:花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性。选择花萼长度,花萼宽度作为特征,使用支持向量机模型对其中前两个类别的花卉进行线性分类,并绘制了数据散点图和决策边界。
时间: 2024-03-16 15:47:45 浏览: 66
下面是使用Python中的Scikit-Learn库实现Iris数据集线性分类的示例代码:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm, datasets
# 加载Iris数据集
iris = datasets.load_iris()
X = iris.data[:, :2] # 只使用前两个特征
y = iris.target
# 只选择前两个类别的数据进行分类
X = X[y != 2]
y = y[y != 2]
# 创建SVM模型
C = 1.0 # SVM正则化参数
svc = svm.SVC(kernel='linear', C=C).fit(X, y)
# 绘制决策边界
# 生成网格数据
xx, yy = np.meshgrid(np.linspace(4, 8, 500), np.linspace(2, 4.5, 500))
# 预测每个网格点的分类
Z = svc.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
# 绘制数据散点图和决策边界
plt.contourf(xx, yy, Z, cmap=plt.cm.coolwarm, alpha=0.8)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.coolwarm)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.xticks(())
plt.yticks(())
plt.title('SVM classification')
plt.show()
```
运行上述代码,将会绘制出Iris数据集中前两个类别的花卉数据散点图,并使用SVM模型对其进行线性分类,并绘制出决策边界。其中,用红色和蓝色表示两个类别的数据点,而底部的彩色区域表示不同分类的决策边界。
阅读全文