基于一元线性回归python
时间: 2024-12-27 11:14:32 浏览: 3
### 使用Python实现一元线性回归模型
#### 数据准备
为了构建一元线性回归模型,数据集中的自变量应当被处理成二维数组的形式。这是因为大多数机器学习算法期望输入的数据具有特定形状。
```python
import pandas as pd
df = pd.DataFrame({
'工龄': [1, 2, 3, 4, 5],
'薪水(K)': [2.5, 3.5, 4.5, 5.5, 6.5]
})
X = df[['工龄']] # 自变量必须是二维形式
Y = df['薪水(K)']
```
#### 构建与训练模型
采用`scikit-learn`库里的`LinearRegression()`类来创建并训练这个简单的一元线性回归模型[^1]。
```python
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X, Y)
```
#### 可视化结果
利用matplotlib绘制散点图以及由该模型预测得到的最佳拟合直线,以便直观理解两者间的关系。
```python
import matplotlib.pyplot as plt
plt.scatter(X, Y)
plt.plot(X, model.predict(X), color='red')
plt.xlabel('Workyear')
plt.ylabel('Salary (K)')
plt.title('Years of Experience vs Salary Prediction')
plt.show()
```
#### 获取模型参数
最后一步是从已训练好的模型中提取斜率(即权重或系数)和截距这两个重要参数,它们共同定义了一条最佳拟合直线方程$y=ax+b$。
```python
print("Slope:", model.coef_[0])
print("Intercept:", model.intercept_)
```
除了上述方法外,还可以借助其他工具包如SciPy的`linregress`函数来进行更详细的统计分析;或者使用StatsModels获取更多关于估计过程的信息,比如标准误差、t检验值等[^2][^3].
阅读全文