线性回归实战
时间: 2023-06-21 18:06:11 浏览: 63
线性回归是一种基本的机器学习算法,它通过拟合数据集中的线性模型来预测一个连续的输出变量。在这里,我将为你提供一个简单的线性回归实战。
首先,我们需要准备数据。我们将使用scikit-learn中的波士顿房价数据集来演示。该数据集包含了波士顿地区的房屋信息以及它们的销售价格。
```python
from sklearn.datasets import load_boston
import pandas as pd
boston = load_boston()
df = pd.DataFrame(boston.data, columns=boston.feature_names)
df['target'] = boston.target
```
接下来,我们需要将数据集分为训练集和测试集。
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(df[boston.feature_names], df['target'], test_size=0.2, random_state=42)
```
然后,我们可以导入线性回归模型并用训练集拟合它。
```python
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(X_train, y_train)
```
现在,我们可以使用测试集来评估模型的性能。
```python
from sklearn.metrics import mean_squared_error
y_pred = lr.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
print(mse)
```
最后,我们可以使用模型来预测一个新的房屋的价格。例如,我们可以使用以下代码来预测一个房屋的价格。
```python
lr.predict([[0.00632, 18.0, 2.31, 0.0, 0.538, 6.575, 65.2, 4.0900, 1.0, 296.0, 15.3, 396.90, 4.98]])
```
以上是一个简单的线性回归实战。当然,这只是一个开始。你可以尝试使用不同的数据集,尝试使用不同的特征和超参数来改进模型的性能。