python实现一元线性回归分析
时间: 2024-09-29 07:05:06 浏览: 46
在Python中,可以使用统计库`scikit-learn`来实现一元线性回归分析。线性回归是一种预测模型,它假设两个变量之间存在线性关系,其中一个变量(自变量)通常是时间或其他连续值,另一个变量(因变量)则是我们试图预测的目标值。
以下是使用`sklearn.linear_model.LinearRegression`类进行简单一元线性回归的基本步骤:
1. 导入所需的库:
```python
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import numpy as np
```
2. 准备数据集:假设有两个列,一列为自变量X,另一列为因变量Y。
```python
X = np.array([...]) # 自变量的数组,例如包含特征数据
y = np.array([...]) # 因变量的数组,例如目标值
```
3. 划分训练集和测试集:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 创建并训练模型:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
5. 预测新数据:
```python
predictions = model.predict(X_test)
```
6. 评估模型性能:
```python
from sklearn.metrics import mean_squared_error, r2_score
mse = mean_squared_error(y_test, predictions)
r2 = r2_score(y_test, predictions)
print("MSE:", mse)
print("R-squared:", r2)
```
阅读全文