用python #11.根据2015-2016年用水量数据，预测编号1-200的用户，2017年每个月用水量，并对预测值进行评价。

好的，具体实现如下：首先，读取数据，进行预处理： ```python import pandas as pd import numpy as np import matplotlib.pyplot as plt from statsmodels.tsa.arima_model import ARIMA from sklearn.metrics import mean_squared_error # 读取数据 data = pd.read_csv('water_usage.csv', index_col='id') # 将缺失值填充为前一个值 data.fillna(method='ffill', inplace=True) # 去除异常值 data = data[(data >= 0) & (data <= 500)] # 平稳性检验 from statsmodels.tsa.stattools import adfuller def test_stationarity(timeseries): # Determing rolling statistics rolmean = timeseries.rolling(12).mean() rolstd = timeseries.rolling(12).std() # Plot rolling statistics: plt.plot(timeseries, color='blue', label='Original') plt.plot(rolmean, color='red', label='Rolling Mean') plt.plot(rolstd, color='black', label='Rolling Std') plt.legend(loc='best') plt.title('Rolling Mean & Standard Deviation') plt.show() # Perform Dickey-Fuller test: print('Results of Dickey-Fuller Test:') dftest = adfuller(timeseries, autolag='AIC') dfoutput = pd.Series(dftest[0:4], index=['Test Statistic','p-value','#Lags Used','Number of Observations Used']) for key,value in dftest[4].items(): dfoutput['Critical Value (%s)'%key] = value print(dfoutput) test_stationarity(data.loc[1:200, '2016-12-31']) ``` 然后，使用ARIMA模型进行预测： ```python # 构建ARIMA模型 model = ARIMA(data.loc[1:200, '2015-01-31':'2016-12-31'], order=(2,1,2)) model_fit = model.fit(disp=0) # 预测2017年每个月的用水量 forecast = model_fit.forecast(steps=12)[0] # 输出预测结果 print(forecast) ``` 最后，使用评价指标对预测结果进行评价： ```python # 计算均方根误差 mse = mean_squared_error(data.loc[1:200, '2017-01-31':'2017-12-31'], forecast) rmse = np.sqrt(mse) print('RMSE: %.2f' % rmse) # 可视化预测结果 plt.plot(data.loc[1:200, '2017-01-31':'2017-12-31'].values.flatten(), label='Actual') plt.plot(forecast, label='Predicted') plt.legend() plt.show() ``` 完整代码如下： ```python import pandas as pd import numpy as np import matplotlib.pyplot as plt from statsmodels.tsa.arima_model import ARIMA from sklearn.metrics import mean_squared_error # 读取数据 data = pd.read_csv('water_usage.csv', index_col='id') # 将缺失值填充为前一个值 data.fillna(method='ffill', inplace=True) # 去除异常值 data = data[(data >= 0) & (data <= 500)] # 平稳性检验 from statsmodels.tsa.stattools import adfuller def test_stationarity(timeseries): # Determing rolling statistics rolmean = timeseries.rolling(12).mean() rolstd = timeseries.rolling(12).std() # Plot rolling statistics: plt.plot(timeseries, color='blue', label='Original') plt.plot(rolmean, color='red', label='Rolling Mean') plt.plot(rolstd, color='black', label='Rolling Std') plt.legend(loc='best') plt.title('Rolling Mean & Standard Deviation') plt.show() # Perform Dickey-Fuller test: print('Results of Dickey-Fuller Test:') dftest = adfuller(timeseries, autolag='AIC') dfoutput = pd.Series(dftest[0:4], index=['Test Statistic','p-value','#Lags Used','Number of Observations Used']) for key,value in dftest[4].items(): dfoutput['Critical Value (%s)'%key] = value print(dfoutput) test_stationarity(data.loc[1:200, '2016-12-31']) # 构建ARIMA模型 model = ARIMA(data.loc[1:200, '2015-01-31':'2016-12-31'], order=(2,1,2)) model_fit = model.fit(disp=0) # 预测2017年每个月的用水量 forecast = model_fit.forecast(steps=12)[0] # 输出预测结果 print(forecast) # 计算均方根误差 mse = mean_squared_error(data.loc[1:200, '2017-01-31':'2017-12-31'], forecast) rmse = np.sqrt(mse) print('RMSE: %.2f' % rmse) # 可视化预测结果 plt.plot(data.loc[1:200, '2017-01-31':'2017-12-31'].values.flatten(), label='Actual') plt.plot(forecast, label='Predicted') plt.legend() plt.show() ```

阅读全文

用python #11.根据2015-2016年用水量数据，预测编号1-200的用户，2017年每个月用水量，并对预测值进行评价。

相关推荐

基于python实现日常消费数据占比分析总结年消费方向附项目源码

月度用电预测

城市用水量预测模型

Python库 | networking_arista-2016.2.5-py2.py3-none-any.whl

DamonGaomu#Python-100-Days-1#94.网络API接口设计1

Python库 | ocflib-2016.12.10.1.48-py2.py3-none-any.whl

Python库 | ocflib-2016.10.31.0.40-py2.py3-none-any.whl

Python库 | p4python-2015.1.1042785-cp27-none-win32.whl

MySQL-python-1.2.2.win32-py2.6

Python库 | onegov.applications-2017.10.8-py3-none-any.whl

mod_python-3.3.1.win32-py2.6-apache2.2.exe

python-3.10.11-embed-amd64.zip

python2-certifi-2016.9.26-2.el7.noarch.rpm

Python库 | geopackage_python-2.0.0.4-py2-none-any.whl

miniagenda:网站于2017年根据FranciscoAndré（https:__www.python-and-python.com_使用Python和Django进行Web开发-从零到部署）中讲授的课程创建

Python库 | tableone-0.4.9-py2.py3-none-any.whl

Python库 | dabest-0.2.0-py2.py3-none-any.whl

Python库 | pylangacq-0.10.0-py2.py3-none-any.whl

Python库 | mode-1.7.0-py2.py3-none-any.whl

最新推荐

Python数据处理课程设计-房屋价格预测

用Python实现四阶龙格-库塔（Runge-Kutta）方法求解高阶微分方程.pdf

python 实现对数据集的归一化的方法(0-1之间)

【K-means算法】{1} —— 使用Python实现K-means算法并处理Iris数据集

使用python脚本自动生成K8S-YAML的方法示例

Java集合ArrayList实现字符串管理及效果展示

管理建模和仿真的文件

【MATLAB信号处理优化】：算法实现与问题解决的实战指南

在西门子S120驱动系统中，更换SMI20编码器时应如何确保数据的正确备份和配置？

实现2D3D相机拾取射线的关键技术