R语言时间序列分类：OSTSC过采样技术提升LSTM性能

需积分: 9 44 浏览量更新于2024-07-09 收藏 1.07MB PDF 举报

"OSTSC：R 中时间序列分类的过采样-研究论文" 这篇研究论文主要介绍了OSTSC（OverSampling for Time Series Classiﬁcation in R）包，这是一个专为R语言设计的强大过采样方法，用于处理单变量但多项式时间序列数据的分类问题。过采样是一种在不平衡数据集中增加少数类样本数量的技术，以改善分类器的性能。在时间序列分析中，不平衡数据集指的是某一类别的样本远多于其他类别，这可能导致分类器倾向于预测占多数的类别。文章首先提供了一个OSTSC包的教程，通过三个测试用例帮助用户快速验证包的功能。这些测试用例旨在展示如何使用该包以及其核心功能的实用性。接着，论文使用两个中等规模的不平衡时间序列数据集来证明OSTSC的性能影响。在这些数据集上，作者应用了基于TensorFlow的长短期记忆（LSTM）分类器，这是一种特殊类型的循环神经网络（RNN），特别适合处理序列数据。通过对过采样和未过采样的数据进行分类，并对比分类器（LSTM）的表现，结果显示OSTSC能够显著提升在高度不平衡时间序列数据上的分类效果。具体来说，论文中提到在一个包含30,000个时间序列观测值的高频交易数据集上，使用OSTSC进行过采样后，LSTM分类器的AUC（曲线下面积）从0.543提高到了0.784。AUC是衡量分类器性能的重要指标，值越接近1表示分类器的性能越好。这一结果强调了OSTSC在处理大规模时间序列分类问题时的有效性和可扩展性。 OSTSC包通过过采样技术改进了RNN分类器，特别是LSTM，对于处理不平衡的时间序列数据集有显著的优势。这对于金融交易、医疗诊断、工业监控等领域的应用具有重大意义，因为这些领域经常遇到时间序列数据的不平衡问题。通过使用OSTSC，研究人员和实践者可以更好地挖掘这些数据中的模式，提高预测准确性和决策质量。

weixin_38517113

粉丝: 3
资源: 888

R语言时间序列分类：OSTSC过采样技术提升LSTM性能

时间序列分析及应用：R语言（原书第2版）.pdf

时间序列分类：基于深度学习的时间序列分类

Mr-SEQL: 实现时间序列分类的DFT-Matlab源代码

resampleX:重采样时间序列-matlab开发

政治学的序列分析-研究论文

一种用于生物多样性时间序列分析的机器学习方法-研究论文

降水预测新方法：逐步回归时间序列与RBF-ANN对比分析

掌握离散时间信号：单位抽样序列与常用操作-程佩青第三版课件

R语言在时间序列分析与Box-Jenkins建模中的应用

数据采样与重采样：Pandas中的时间序列采样技术

最新资源