使用逻辑回归对鸢尾花分类 数据集只截取了两类鸢尾花:鸢尾属植物和鸢尾-杂色 使用逻辑回归建立分类模型,对鸢尾花数据集进行分类 数据特征包括:花萼长度、花萼宽度、花瓣长度、花瓣宽度,英文可以写为:SepalLengthCm,SepalWidthCm,PetalLengthCm,PetalWidthCm 数据标签为鸢尾花的分类,英文可用班级表示
时间: 2024-03-11 21:48:36 浏览: 53
逻辑回归-鸢尾花数据集分类
好的,以下是使用Python中的Scikit-learn库来建立逻辑回归模型对鸢尾花进行分类的示例代码:
```python
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
# 读取数据集
data = pd.read_csv('iris.csv')
# 只保留鸢尾属植物和鸢尾-杂色2类
data = data[data['Species'].isin(['Iris-versicolor', 'Iris-setosa'])]
# 设置特征和标签
X = data[['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm']]
y = data['Species'].replace({'Iris-versicolor': 0, 'Iris-setosa': 1})
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 建立逻辑回归模型
model = LogisticRegression()
# 训练模型
model.fit(X_train, y_train)
# 在测试集上预测
y_pred = model.predict(X_test)
# 输出模型的准确率
print('准确率为:', model.score(X_test, y_test))
```
在上述代码中,我们首先读取了鸢尾花数据集,然后只保留了鸢尾属植物和鸢尾-杂色两类花。接着,我们设置了特征和标签,其中特征包括花萼长度、花萼宽度、花瓣长度和花瓣宽度,标签用0和1表示不同的花。
然后,我们将数据集划分为训练集和测试集,并使用Scikit-learn中的LogisticRegression函数建立逻辑回归模型,并在训练集上进行训练。接着,在测试集上进行预测,并输出模型的准确率。
需要注意的是,这里的数据集只包含了两类花,因此模型的准确率可能并不是很高。如果想要更好的分类效果,可以使用更多的数据,或者对特征进行更加细致的处理。
阅读全文