Python基于逻辑回归预测鸢尾花品种
时间: 2024-10-15 09:30:02 浏览: 34
基于逻辑回归的鸢尾花二分类实验python源码+数据集+详细注释.zip
5星 · 资源好评率100%
Python中的逻辑回归通常用于二分类问题,而预测鸢尾花品种通常是分类任务,更适合使用决策树、K近邻等算法。不过,逻辑回归也可以应用于鸢尾花数据集,特别是当我们将它视为二分类问题(比如区分两个最相似的品种),通过将其他品种作为“非此品种”来进行处理。
首先,你需要导入必要的库如`sklearn`中的`LogisticRegression`,以及数据集(可以用`iris`数据集,它是scikit-learn自带的)。然后,按照以下步骤操作:
1. 导入库并加载数据:
```python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
import pandas as pd
iris = datasets.load_iris()
```
2. 准备数据(例如,选择两个品种作为类别,例如Setosa和Versicolor):
```python
X = iris.data[:, :2] # 取前两维特征
y = (iris.target == 0) + (iris.target == 1) # 将目标值编码为二进制,0代表Setosa,1代表Versicolor
```
3. 划分训练集和测试集:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 创建并训练模型:
```python
model = LogisticRegression()
model.fit(X_train, y_train)
```
5. 预测和评估:
```python
y_pred = model.predict(X_test)
accuracy = model.score(X_test, y_test)
```
阅读全文