kaggle练习-共享单车数据分析_kaggle共享单车预测

kaggle

81 浏览量更新于2023-03-03 评论 3 收藏 186KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

kaggle练习练习-共享单车数据分析共享单车数据分析

项目背景：提供两年的每小时租金数据。训练集是每个月的前19天，而测试集是每月的20号到月底。必须仅使用租借期之前的可用信息来预测测试集涵盖的每个小时内租用的自行车

总数。

一、载入数据一、载入数据

1.1收集数据收集数据

一般而言，数据由甲方提供。若甲方不提供数据，则需要根据相关问题从网络爬取，或者以问卷调查形式收集。本次共享单车数据分析项目数据源于Kaggle

[https://www.kaggle.com/c/bike-sharing-demand/data]。

1.2 载入数据载入数据

// 载入工具包

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from datetime import datetime

import matplotlib

from sklearn.ensemble import RandomForestRegressor

from sklearn.grid_search import GridSearchCV

%matplotlib inline

// 载入数据

train=pd.read_csv('/python/bike-sharingdemand/train.csv')

test=pd.read_csv('/python/bike-sharing-demand/test.csv')

//查看数据前5行

train.head()

//查看数据基本信息

train.info()

test.info()

训练数据共有12列，10886样本，并且数据无缺失；测试数据共有9列，6493样本。测试数据相对于训练数据，缺少casual（未注册用户租车数量）、registered（注册用户租车数

量）、count（总租车数量）三列，这需要通过最终的模型预测得出。

特征说明特征说明

datetime：时间。年月日小时格式

season：季节。1：春天；2：夏天；3：秋天；4：冬天

holiday：是否节假日。0：否；1：是

workingday：是否工作日。0：否；1：是

weather：天气。1：晴天；2：阴天；3：小鱼或小雪；4：恶劣天气

temp：实际温度

atemp：体感温度

humidity：湿度

windspeed：风速

casual：未注册用户租车数量

registered：注册用户租车数量

count：总租车数量

二、数据预处理二、数据预处理

2.1数据缺失值处理数据缺失值处理

//查看数据基本信息

train.info()

test.info()

数据没有缺失值，因此不需要进行缺失值的处理

2.2 数据异常值处理数据异常值处理

//数据描述

train.describe()

原创文章 1获赞 0访问量 21

关注

私信

展开阅读全文

作者：muxuehan0

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余0页未读，立即下载

weixin_38607026

粉丝: 8
资源: 914

会员权益专享

kaggle练习-共享单车数据分析

评论0

会员权益专享

最新资源

kaggle练习-共享单车数据分析

评论0

Kaggle共享单车数据分析 .pdf

BikeSharingDemand:Kaggle 竞赛预测城市共享单车系统的使用情况

国内某共享单车数据集.zip

机器学习kaggle实战-泰坦尼克号问题知识梳理

kaggle中的共享单车数据集进行多元回归只有0.24分怎么办

利用统计推断，检验kaggle中的共享单车数据集里是否是工作日是否对租车数量产生影响，给出详细的代码

Kaggle Datasets - Crimes in Chicago 数据处理

利用统计推断，检验kaggle中的共享单车数据集里季节是否对租车数量产生影响，给出详细的代码

怎么利用kaggle中的共享单车数据集构建神经网络模型，具体代码和解释是什么

kaggle共享单车

kaggle中的共享单车数据集进行多元回归的具体代码和详细注释

根据kaggle中的共享单车数据集，对体感温度，湿度，风速做对于租借数量影响的多元线性回归，给出详细代码和解释

Kaggle Datasets - Crimes in Chicago 字符型数据处理

kaggle digit-recognizer 代码示例

kaggle共享单车的比赛案例

将kaggle共享单车数据导入R后，使用r语言分析在一个或多个参数组合考虑的情况下什么时候租凭量最大

绘制kaggle共享单车数据集中注册过和未注册过用户在每个月共享单车使用数量的柱状图代码

绘制kaggle共享单车数据集中注册过和未注册过用户在一周内每一天共享单车使用数量的柱状图代码

使用r语言对kaggle共享单车数据做总体属性的参数估计

会员权益专享

最新资源