jupyter -工作年限和对应年薪简单数据集,根据它绘出数据的散点图,并尝试应用线性回归模型拟合数据,求出直线方程
时间: 2024-11-27 14:23:36 浏览: 34
Jupyter是一个交互式的数据分析环境,常用于Python编程,尤其适合于数据可视化和机器学习项目。如果你想创建一个关于工作年限和年薪的数据集的散点图,并利用线性回归模型进行拟合,你可以按照以下步骤操作:
1. 首先,你需要有一个包含工作年限(通常作为x轴变量)和年薪(y轴变量)的数据集。这个数据可以手动生成,例如使用numpy生成随机数,或者从实际数据库或CSV文件读取。
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
# 假设我们有如下数据
years_of_experience = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
salary = np.linspace(30000, 120000, len(years_of_experience)) + np.random.normal(0, 5000, size=len(years_of_experience))
data = {'Years of Experience': years_of_experience, 'Salary': salary}
df = pd.DataFrame(data)
```
2. 接下来,绘制散点图:
```python
plt.scatter(df['Years of Experience'], df['Salary'])
plt.xlabel('Years of Experience')
plt.ylabel('Salary')
plt.title('Scatter Plot of Years of Experience vs Salary')
plt.show()
```
3. 应用线性回归模型并拟合数据:
```python
X = df[['Years of Experience']]
y = df['Salary']
model = LinearRegression()
model.fit(X, y)
# 输出模型系数(斜率)和截距
slope, intercept = model.coef_[0], model.intercept_
print(f"Linear Regression Equation: {slope:.2f} * Years of Experience + {intercept:.2f}")
```
这将得到一个简单的线性回归模型,描述年薪如何随着工作经验变化。注意,这是一个理想化的例子,实际数据可能会更复杂,需要进一步的数据清理和特征工程。
阅读全文