用python代码构建交通事故率的线性回归模型
时间: 2023-11-13 08:09:13 浏览: 293
基于python的线性回归算法设计与实现
以下是一个用Python代码构建交通事故率的线性回归模型的例子:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
# 读取数据
df = pd.read_csv('accidents.csv')
# 数据清洗
df = df.dropna() # 删除缺失值
# 提取特征和标签
X = df[['population', 'income', 'age']] # 特征
y = df['accidents'] # 标签
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建线性回归模型
regressor = LinearRegression()
regressor.fit(X_train, y_train)
# 输出模型参数
print('Coefficients: ', regressor.coef_)
print('Intercept: ', regressor.intercept_)
# 预测测试集结果
y_pred = regressor.predict(X_test)
# 绘制散点图和回归线
plt.scatter(X_test['population'], y_test, color='black')
plt.plot(X_test['population'], y_pred, color='blue', linewidth=3)
plt.xlabel('Population')
plt.ylabel('Accidents')
plt.show()
```
这个例子使用了`pandas`库来读取和清洗数据,使用了`sklearn`库来创建和训练线性回归模型,使用了`matplotlib`库来绘制散点图和回归线。在代码中,我们将人口、收入和年龄作为特征,将事故率作为标签,然后使用训练集来训练模型,最后使用测试集来评估模型的性能。我们还绘制了一个散点图和回归线,以可视化模型的预测结果。
阅读全文