采用 scikit-learn 中的 LogisticRegression 逻辑回归模型对 iris 数据集进行二分类
时间: 2024-02-11 14:04:00 浏览: 91
基于逻辑回归模型对 iris 数据进行二分类和多分类-sklearn实现.zip
5星 · 资源好评率100%
好的,我可以为您讲解如何使用 LogisticRegression 模型进行 iris 数据集的二分类。
首先,我们需要导入 iris 数据集和 LogisticRegression 模型:
```python
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
```
然后,我们可以加载 iris 数据集并将其分为两类。这里我们以 setosa 和 versicolor 两种花为例:
```python
iris = load_iris()
# 取出 setosa 和 versicolor 两种花的数据
X = iris.data[:100, :]
y = iris.target[:100]
# 将类别为 0 的花标记为 -1,将类别为 1 的花标记为 1
y = np.where(y == 0, -1, 1)
```
接着,我们可以使用 LogisticRegression 模型进行训练和预测:
```python
# 创建逻辑回归模型对象
clf = LogisticRegression()
# 训练模型
clf.fit(X, y)
# 预测新数据
new_data = np.array([[5.7, 3.0, 4.2, 1.2], [5.5, 2.3, 4.0, 1.3]])
clf.predict(new_data)
```
在上述代码中,我们创建了一个 LogisticRegression 对象 clf,然后使用 fit() 方法训练模型并使用 predict() 方法进行预测。最后,我们使用两个新的数据点进行测试,并输出预测结果。
注意,这里我们只使用了 iris 数据集中的前两个特征进行训练和预测。如果您想使用所有特征,只需将 X 赋值为 iris.data[:,:2]。另外,由于 iris 数据集已经经过预处理和归一化,所以在这里我们没有进行额外的数据预处理。
阅读全文