python线性回归使用sklearn包中加载鸢尾花数据集
时间: 2024-10-11 15:09:25 浏览: 42
在Python中,如果你想要使用scikit-learn(sklearn)库来进行线性回归,并且想先加载经典的鸢尾花数据集(Iris dataset),通常步骤如下:
首先,你需要安装所需的库,如果还没有安装,可以使用pip命令:
```bash
pip install numpy pandas scikit-learn
```
然后,导入必要的模块并加载鸢尾花数据集:
```python
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
# 加载鸢尾花数据集
iris = load_iris() # 返回的是一个Bunch对象,包含了数据和元数据
X = iris.data # 特征数据,形状 (150, 4) 表示150个样本,每个有4个特征
y = iris.target # 目标变量,形状 (150,),表示150个样本对应的类别
# 对数据进行预处理,例如拆分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并初始化线性回归模型
model = LinearRegression()
# 训练模型
model.fit(X_train, y_train)
# 现在你可以用这个模型对新的数据进行预测
predictions = model.predict(X_test)
```
阅读全文