Python最小二乘回归
时间: 2024-08-02 15:01:13 浏览: 108
Python最小二乘法回归(Least Squares Regression)是一种常用的统计学习方法,它通过找到一条直线或曲线(模型),使得所有观测数据点到这条线的距离(残差平方和)之和最小,以此来拟合数据并预测未来值。在Python中,可以使用`sklearn.linear_model.LinearRegression`模块来实现这个过程。
基本步骤如下:
1. 导入所需的库:
```python
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
```
2. 准备数据集,将其划分为特征(X)和目标变量(y):
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
3. 创建并训练模型:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
4. 预测并评估性能:
```python
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
```
阅读全文