首页 Bike Sharing Demand数据集如何进行统计推断，给出详细代码

Bike Sharing Demand数据集如何进行统计推断，给出详细代码

时间: 2024-03-01 21:52:16 浏览: 179

Bike Sharing Demand 数据集可以通过许多统计方法进行推断，例如线性回归、决策树、随机森林等。下面是一个使用线性回归模型进行推断的代码示例： ```python import pandas as pd import numpy as np from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split # 读取数据集 data = pd.read_csv('BikeSharingDemand.csv') # 数据预处理 data['datetime'] = pd.to_datetime(data['datetime']) data['year'] = data['datetime'].dt.year data['month'] = data['datetime'].dt.month data['day'] = data['datetime'].dt.day data['hour'] = data['datetime'].dt.hour # 特征选择 X = data[['temp', 'atemp', 'humidity', 'windspeed', 'year', 'month', 'day', 'hour']] y = data['count'] # 数据集划分 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 模型训练 model = LinearRegression() model.fit(X_train, y_train) # 模型评估 score = model.score(X_test, y_test) print('R2 score:', score) # 预测 y_pred = model.predict(X_test) ``` 这段代码的功能包括读取数据集、数据预处理、特征选择、数据集划分、模型训练、模型评估和预测。其中，特征选择包括选择了温度、湿度、风速等特征，数据集划分采用了 80/20 的比例，模型评估采用 R2 分数。你可以根据需要进行修改和优化。

阅读全文