使用Python的scikit-learn库,编写一个程序来加载鸢尾花(Iris)数据集,训练一个逻辑回归模型,并对数据集中的某些样本进行预测。(每题40分,共40分)
时间: 2024-11-22 11:34:27 浏览: 15
首先,你需要安装`scikit-learn`库,如果你还没有安装,可以使用pip安装:
```bash
pip install scikit-learn`加载鸢尾花数据集,训练逻辑回归模型,并进行预测:
```python
# 导入所需的库
from sklearn import datasets
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data # 特征数据
y = iris.target # 类别标签
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练逻辑回归模型
logreg = LogisticRegression()
logreg.fit(X_train, y_train)
# 对测试集进行预测
y_pred = logreg.predict(X_test)
# 计算预测准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
# 对新样本进行预测
# 假设我们有新的样本数据 new_sample
new_sample = [5.1, 3.5, 1.4, 0.2] # 鸢尾花的四个特征值
prediction = logreg.predict([new_sample])
print("Prediction for new sample:", prediction)
```
在这个例子中,我们首先加载了鸢尾花数据集,然后将数据分为训练集和测试集。接着,我们创建了一个逻辑回归模型并对训练集进行了拟合。最后,我们利用模型对测试集进行预测,并评估了预测的准确性。
阅读全文