import pandas as pd import numpy as np import matplotlib.pyplot as plt from statsmodels.tsa.arima.model import ARIMA from statsmodels.graphics.tsaplots import plot_acf, plot_pacf plt.rcParams['font.sans-serif']=['SimHei'] import matplotlib as mpl mpl.rcParams['axes.unicode_minus'] = False import warnings warnings.filterwarnings("ignore") years = range(1997, 2004) months = range(1, 13) data = [ [9.4, 11.3, 16.8, 19.8, 20.3, 18.8, 20.9, 24.9, 24.7, 24.3, 19.4, 18.6], [9.6, 11.7, 15.8, 19.9, 19.5, 17.8, 17.8, 23.3, 21.4, 24.5, 20.1, 15.9], [10.1, 12.9, 17.7, 21, 21, 20.4, 21.9, 25.8, 29.3, 29.8, 23.6, 16.5], [11.4, 26, 19.6, 25.9, 27.6, 24.3, 23, 27.8, 27.3, 28.5, 32.8, 18.5], [11.5, 26.4, 20.4, 26.1, 28.9, 28, 25.2, 30.8, 28.7, 28.1, 22.2, 20.7], [13.7, 29.7, 23.1, 28.9, 29, 27.4, 26, 32.2, 31.4, 32.6, 29.2, 22.9], [15.4, 17.1, 23.5, 11.6, 1.78, 2.61, 8.8, 16.2, None, None, None, None] ] df = pd.DataFrame(data, columns=range(1, 13), index=range(1997, 2004)) df.index.name = '年份' # 平稳性检验 def test_stationarity(timeseries): # 将数组转换为 Series 对象 series = pd.Series(timeseries) # 计算移动平均和移动标准差 rolling_mean = series.rolling(window=3).mean() rolling_std = series.rolling(window=3).std() # 绘制移动平均和移动标准差 plt.figure(figsize=(10, 6),dpi=500) plt.plot(series.values.flatten(), label='原始数据') plt.plot(rolling_mean.values.flatten(), label='移动平均') plt.plot(rolling_std.values.flatten(), label='移动标准差') plt.xlabel('月数') plt.ylabel('接待人数(万人)') plt.title('移动平均和移动标准差') plt.legend() plt.show() # 执行ADF单位根检验 from statsmodels.tsa.stattools import adfuller result = adfuller(series.dropna()) print('ADF检验结果:') print(f'ADF统计量: {result[0]}') print(f'p-value: {result[1]}') print(f'临界值: {result[4]}') # 进行平稳性检验 test_stationarity(df.stack().values.flatten()) # 差分处理 df_diff = df.diff().dropna()
时间: 2024-01-28 10:05:01 浏览: 153
这段代码是一个Python程序,它的功能是进行时间序列分析。首先,导入了一些必要的模块和库,如pandas、numpy、matplotlib等。然后,定义了一个二维数组data,并将其转换为pandas的DataFrame格式。接下来,定义了一个名为test_stationarity的函数,用于检验时间序列的平稳性。具体而言,该函数计算了时间序列的移动平均和移动标准差,并绘制了它们的图形,然后执行ADF单位根检验,以确定时间序列是否平稳。最后,对原始数据进行了差分处理,并保存在新的DataFrame df_diff中。
相关问题
import pandas as pd import numpy as np import matplotlib.pyplot as plt from statsmodels.tsa.arima_model import ARIMA # 读取数据 data = pd.read_csv('data.csv', header=None, names=['value']) # 绘制原始数据图 plt.plot(data) plt.show() # ARIMA模型拟合 model = ARIMA(data, order=(1, 1, 1)) results = model.fit(disp=-1) # 预测未来3个月的数据 forecast = results.forecast(steps=90) # 绘制预测数据图 plt.plot(forecast) plt.show()
这段代码实现了对时间序列数据的 ARIMA 模型拟合和预测。具体解释如下:
首先,通过 pandas 库读取了一个名为 data.csv 的文件,文件中只有一列数据,通过 header=None 和 names=['value'] 参数指定了该列的名称。然后,使用 matplotlib 库绘制了原始数据图。
接着,创建了一个 ARIMA 模型,其中 order=(1, 1, 1) 表示该模型的阶数,即 AR 阶数为 1,差分次数为 1,MA 阶数为 1。然后,使用 fit() 方法对模型进行拟合。
最后,使用 forecast() 方法预测未来 3 个月的数据,steps=90 表示预测 90 个时间步长。然后,使用 matplotlib 库绘制了预测数据图。
需要注意的是,这段代码只是一个简单的示例,如果要对时间序列数据进行准确预测,需要综合考虑多个因素,如历史数据、趋势、季节性等,以及对模型参数的调整和优化。
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom statsmodels.tsa.arima_model import ARIMAfrom sklearn.metrics import mean_squared_errorimport pymysqlimport time, osimport reimport requestsimport urllibfrom datetime import datetimefrom statsmodels.graphics.tsaplots import plot_acf, plot_pacf# 导入模块import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom statsmodels.tsa.arima_model import ARIMAfrom sklearn.metrics import mean_squared_errorimport pymysqlfrom datetime import datetimefrom statsmodels.graphics.tsaplots import plot_acf, plot_pacf# 连接数据库connect = pymysql.connect(host='localhost', # 本地数据库 user='root', password='123456', port=3306, charset='utf8', database='sheji') # 数据库名称cur = connect.cursor()# 读取数据try: select_sqli = "SELECT time,xiaoliang FROM sale where chexing='海豚';" cur.execute(select_sqli) data = pd.DataFrame(cur.fetchall(), columns=['time', 'xiaoliang'])except Exception as e: print("读取数据失败:", e)else: print("读取数据成功")# 转换时间格式data['time'] = pd.to_datetime(data['time'], format='%Y-%m')data = data.set_index('time')diff_data = data.diff().dropna()# 绘制自相关图和偏自相关图plot_acf(diff_data)plot_pacf(diff_data)# 确定 ARIMA 模型的参数p = 1d = 1q = 1model = ARIMA(data, order=(p, d, q))model_fit = model.fit(disp=0)# 预测销量y_pred = model_fit.predict(len(data), len(data) + 11, typ='levels')# 绘制预测结果plt.plot(data)plt.plot(y_pred, color='red')plt.show()# 关闭数据库连接cur.close()connect.close()请将这段代码改为移动平均模型
下面是将上述代码改为移动平均模型的示例:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.tsa.arima_model import ARIMA
from sklearn.metrics import mean_squared_error
import pymysql
from datetime import datetime
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
# 连接数据库
connect = pymysql.connect(host='localhost', # 本地数据库
user='root',
password='123456',
port=3306,
charset='utf8',
database='sheji')
# 数据库查询语句
select_sql = "SELECT time, xiaoliang FROM sale WHERE chexing='海豚';"
# 读取数据
try:
data = pd.read_sql(select_sql, connect, index_col='time', parse_dates=True)
except Exception as e:
print("读取数据失败:", e)
else:
print("读取数据成功")
# 移动平均模型
window_size = 3
data_ma = data.rolling(window_size).mean()
data_ma.dropna(inplace=True)
# 绘制自相关图和偏自相关图
plot_acf(data_ma)
plot_pacf(data_ma)
# 选择移动平均模型的滞后阶数
q = 1
# 构建移动平均模型并拟合数据
model = ARIMA(data_ma, order=(0, 0, q))
model_fit = model.fit(disp=False)
# 预测销量并绘图
y_pred = model_fit.predict(len(data_ma), len(data_ma) + 11, typ='levels')
plt.plot(data_ma, label='Original Data')
plt.plot(y_pred, color='red', label='Predicted Data')
plt.legend()
plt.show()
# 关闭数据库连接
connect.close()
```
以上代码通过 rolling() 函数进行滑动窗口处理,计算移动平均值,并选择滞后阶数,然后构建移动平均模型,拟合数据,并进行预测和绘图。需要注意的是,移动平均模型需要对数据进行平稳化处理,否则预测结果可能会出现误差。
阅读全文
相关推荐














