鸢尾花二分类逻辑回归
时间: 2023-11-21 13:51:32 浏览: 108
逻辑回归是一种二分类算法,它可以用于预测某个事件发生的概率。鸢尾花数据集是一个经典的机器学习数据集,其中包含了三种不同种类的鸢尾花的测量数据。我们可以使用逻辑回归算法对这个数据集进行二分类,将其中两种鸢尾花分为一类,另一种鸢尾花分为另一类。具体步骤如下:
1. 数据预处理:将数据集分为训练集和测试集,并对数据进行标准化处理。
2. 模型训练:使用训练集对逻辑回归模型进行训练,求出模型的参数w和b。
3. 模型预测:使用测试集对模型进行预测,计算出每个测试样本属于正类的概率。
4. 模型评估:使用评估指标(如准确率、精确率、召回率等)对模型进行评估。
下面是一个简单的Python代码示例,用于实现鸢尾花二分类逻辑回归:
```python
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# 加载数据集
iris = load_iris()
X = iris.data[:100, :]
y = iris.target[:100]
# 数据预处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
sc = StandardScaler()
X_train_std = sc.fit_transform(X_train)
X_test_std = sc.transform(X_test)
# 模型训练
lr = LogisticRegression(C=100.0, random_state=0)
lr.fit(X_train_std, y_train)
# 模型预测
y_pred = lr.predict(X_test_std)
# 模型评估
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
```
阅读全文