GluonTS深度解析：概率时间序列建模与MXNet集成

78 浏览量更新于2023-05-04 收藏 152KB PDF 举报

"GluonTS 是一个概率时间序列建模的工具箱，它提供了用于构建、训练和评估时间序列预测模型的组件和工具。这个工具包基于 MXNet 框架，支持预测模型，同时也适用于时间序列分类和异常检测等任务。GluonTS 并非设计为开箱即用的商业预测解决方案，而是面向研究人员和工程师，方便他们定制算法和尝试不同的模型。工具包中包含了构建新模型的组件，如损失函数、特征处理流水线、日期特征等，以及数据加载、处理、预设模型、可视化和评估指标的功能。此外，GluonTS 还提供了一些公开数据集，便于实验和验证模型性能。" GluonTS 的核心功能包括： 1. **组件与工具**：GluonTS 提供了构建新模型所需的组件，比如损失函数，这有助于定义模型的学习目标。特征处理流水线帮助预处理时间序列数据，以便更好地适应模型。日期特征模块允许将时间信息转化为模型可以理解的形式。 2. **数据处理**：数据加载和处理是关键部分，GluonTS 提供了便捷的接口来访问和处理时间序列数据集。`get_dataset` 函数可以用来加载内置数据集，如"M4_hourly"，并且可以通过`to_pandas`转换为Pandas DataFrame以便进一步分析。 3. **预设模型**：GluonTS 包含多种预设的时间序列预测模型，这些模型已经过优化，可以快速用于实验。这些模型涵盖了多种预测方法，为用户提供了多种选择。 4. **评估与可视化**：GluonTS 提供了绘图工具和评估指标，可以帮助用户可视化预测结果并与实际值进行对比，从而评估模型的性能。这包括绘制预测分布与实际值的比较，以及计算诸如平均绝对误差 (MAE) 或均方根误差 (RMSE) 等度量。 5. **数据集**：GluonTS 包含一系列人工和真实世界的数据集，可以用于模型训练和验证。数据集分为训练集和测试集，其中`dataset.train`用于模型训练，`dataset.test`用于模型在未见过的数据上的推理。使用 GultonTS 开始一个项目时，首先需要导入必要的库，如 MXNet、Gluon、NumPy、Pandas 和 Matplotlib。然后，可以利用`get_dataset`加载数据集，并使用提供的接口进行数据处理和模型训练。在模型训练完成后，可以使用测试集进行模型性能的评估，并根据评估结果调整模型参数或尝试新的模型结构。这种灵活性使得 GluonTS 成为时间序列分析领域的一个强大工具。

GluonTS – 概率时间序列建模概率时间序列建模(Probabilistic Time Series

Modeling)

最近在研究时间序列预测模型的的研究。关于时间序列的更多介绍，知乎已经有大佬进行详细系统的分类介绍了。有兴趣的可最近在研究时间序列预测模型的的研究。关于时间序列的更多介绍，知乎已经有大佬进行详细系统的分类介绍了。有兴趣的可

以直接去这里看一下。以直接去这里看一下。

这里是关于GluonTS官方API中Quick Start Tutorial部分的源码学习，通过阅读教程案例进行相关的翻译和一些自己的心得总

结，如有错误，欢迎指正。官方API案例地址

1. 快速开始向导快速开始向导

GluonTS工具箱包含用于使用MXNet构建时间序列模型的组件和工具。当前包含的模型是预测模型，但组件还支持其他时间

序列用例，例如分类或异常检测。

该工具包并非旨在作为企业或最终用户的预测解决方案，而是针对想要调整算法或构建和试验自己模型的科学家和工程师。

内容包括：内容包括：

用于构建新模型的组件（释然函数，特征处理的pipelines，日期特征，等）

数据加载和处理

多种预设模型

绘图和评估指标

人工数据集和真实数据集

导入相关库：

# Third-party imports

%matplotlib inline

import mxnet as mx

from mxnet import gluon

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import json

2. 数据集数据集datasets

GluonTS自带了许多公开的数据集，可以直接导入

from gluonts.dataset.repository.datasets import get_dataset, dataset_recipes

from gluonts.dataset.util import to_pandas

要下载其中一个内置数据集，只需使用上述名称之一调用get_dataset。 GluonTS可以重新使用保存的数据集，因此无需再次

下载：只需设置regenerate = False。

dataset = get_dataset("m4_hourly", regenerate=True)

通常，GluonTS提供的数据集是由三个主要成员组成的对象：

dataset.train 是用于训练的数据条目的可迭代集合。每个条目对应一个时间序列

dataset.test 是用于推理的数据条目的可迭代集合。测试数据集是火车数据集的扩展版本，在每个时间序列的末尾包含一个在训

练期间未看到的窗口。该窗口的长度等于建议的预测长度。

dataset.metadata 包含数据集的元数据，例如时间序列的频率，建议的预测范围，相关特征等。

# 绘制训练集数据图像

entry = next(iter(dataset.train))

train_series = to_pandas(entry)

train_series.plot()

plt.grid(which="both")

plt.legend(["train series"], loc="upper left")

plt.show()

# 绘制测试集数据图像

entry = next(iter(dataset.test))

test_series = to_pandas(entry)

test_series.plot()

plt.axvline(train_series.index[-1], color='r') # end of train dataset

plt.grid(which="both")

plt.legend(["test series", "end of train series"], loc="upper left")

plt.show()

print(f"Length of forecasting window in test dataset: {len(test_series) - len(train_series)}")

print(f"Recommended prediction horizon: {dataset.metadata.prediction_length}")

print(f"Frequency of the time series: {dataset.metadata.freq}")

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38694006

粉丝: 6
资源: 923

GluonTS深度解析：概率时间序列建模与MXNet集成

modeltime_gluonts_saturn_cloud

Python中的概率时间序列建模-Python开发

gluon-ts：Python中的概率时间序列建模

PyTorchTS：利用GluonTS实现PyTorch概率时间序列预测

pytorch-ts:基于GluonTS后端的基于PyTorch的概率时间序列预测框架

Scalable Optimization via Probabilistic Modeling

时间序列预测代码matlab-online-probabilistic-load-forecasting:在线概率负载预测

概率编程Practical.Probabilistic.Programming

概率机器学习，Probabilistic Machine Learning

保护概率分类_Protected probabilistic classification

最新资源