R语言时间序列分类:OSTSC过采样技术提升LSTM性能
需积分: 9 44 浏览量
更新于2024-07-09
收藏 1.07MB PDF 举报
"OSTSC:R 中时间序列分类的过采样-研究论文"
这篇研究论文主要介绍了OSTSC(OverSampling for Time Series Classification in R)包,这是一个专为R语言设计的强大过采样方法,用于处理单变量但多项式时间序列数据的分类问题。过采样是一种在不平衡数据集中增加少数类样本数量的技术,以改善分类器的性能。在时间序列分析中,不平衡数据集指的是某一类别的样本远多于其他类别,这可能导致分类器倾向于预测占多数的类别。
文章首先提供了一个OSTSC包的教程,通过三个测试用例帮助用户快速验证包的功能。这些测试用例旨在展示如何使用该包以及其核心功能的实用性。
接着,论文使用两个中等规模的不平衡时间序列数据集来证明OSTSC的性能影响。在这些数据集上,作者应用了基于TensorFlow的长短期记忆(LSTM)分类器,这是一种特殊类型的循环神经网络(RNN),特别适合处理序列数据。通过对过采样和未过采样的数据进行分类,并对比分类器(LSTM)的表现,结果显示OSTSC能够显著提升在高度不平衡时间序列数据上的分类效果。
具体来说,论文中提到在一个包含30,000个时间序列观测值的高频交易数据集上,使用OSTSC进行过采样后,LSTM分类器的AUC(曲线下面积)从0.543提高到了0.784。AUC是衡量分类器性能的重要指标,值越接近1表示分类器的性能越好。这一结果强调了OSTSC在处理大规模时间序列分类问题时的有效性和可扩展性。
OSTSC包通过过采样技术改进了RNN分类器,特别是LSTM,对于处理不平衡的时间序列数据集有显著的优势。这对于金融交易、医疗诊断、工业监控等领域的应用具有重大意义,因为这些领域经常遇到时间序列数据的不平衡问题。通过使用OSTSC,研究人员和实践者可以更好地挖掘这些数据中的模式,提高预测准确性和决策质量。
829 浏览量
2021-08-11 上传
点击了解资源详情
2021-05-31 上传
2021-06-09 上传
2021-05-19 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38517113
- 粉丝: 3
- 资源: 888
最新资源
- 正整数数组验证库:确保值符合正整数规则
- 系统移植工具集:镜像、工具链及其他必备软件包
- 掌握JavaScript加密技术:客户端加密核心要点
- AWS环境下Java应用的构建与优化指南
- Grav插件动态调整上传图像大小提高性能
- InversifyJS示例应用:演示OOP与依赖注入
- Laravel与Workerman构建PHP WebSocket即时通讯解决方案
- 前端开发利器:SPRjs快速粘合JavaScript文件脚本
- Windows平台RNNoise演示及编译方法说明
- GitHub Action实现站点自动化部署到网格环境
- Delphi实现磁盘容量检测与柱状图展示
- 亲测可用的简易微信抽奖小程序源码分享
- 如何利用JD抢单助手提升秒杀成功率
- 快速部署WordPress:使用Docker和generator-docker-wordpress
- 探索多功能计算器:日志记录与数据转换能力
- WearableSensing: 使用Java连接Zephyr Bioharness数据到服务器