在使用scikit-learn进行线性回归模型的构建时,如何正确地导入波士顿房价数据集,并对模型的性能进行初步评估?请提供相应的代码示例。
时间: 2024-12-09 20:15:49 浏览: 7
为了对线性回归模型进行构建和性能评估,首先需要了解scikit-learn库提供的数据集接口。波士顿房价数据集是scikit-learn内置的一个数据集,可以通过加载sklearn.datasets模块中的`load_boston()`函数获得。以下是一个完整的示例,展示了如何导入数据集、构建线性回归模型,并进行初步的性能评估:
参考资源链接:[Python sklearn库回归算法实验:线性回归与数据分析](https://wenku.csdn.net/doc/3bxvvy2dzt?spm=1055.2569.3001.10343)
```python
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
# 加载波士顿房价数据集
boston_dataset = load_boston()
boston = pd.DataFrame(boston_dataset.data, columns=boston_dataset.feature_names)
boston['MEDV'] = boston_dataset.target
# 数据集拆分:训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(boston.drop('MEDV', axis=1), boston['MEDV'], test_size=0.2, random_state=42)
# 构建线性回归模型
linear_regressor = LinearRegression()
linear_regressor.fit(X_train, y_train)
# 预测测试集的结果
y_pred = linear_regressor.predict(X_test)
# 性能评估
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f
参考资源链接:[Python sklearn库回归算法实验:线性回归与数据分析](https://wenku.csdn.net/doc/3bxvvy2dzt?spm=1055.2569.3001.10343)
阅读全文