第 卷第 期
哈尔滨工程大学学报
Vol
年 月
Journal of Harbin Engineering University
Nov
doi jissn
时 间 序 列 部 分 周 期 模 式 的 更 新 算 法
王晓晔
肖迎元
张德干
天津理工大学 智能计算及软件新技术重点实验室天津 天津理工大学 计算机视觉与系统省部共建教育部重
点实验室天津
摘要针对在线增量部分周期模式挖掘中计算复杂度过高的问题提出了一种带移动时间窗的时间序列部分周期模式
挖掘算法在时间序列的数据挖掘过程中某些应用场合只要求对近期的时间序列数据进行挖掘发现部分周期模式作
为时间序列未来行为趋势的预测因此在挖掘过程中利用时间窗口在先前挖掘结果的基础上对最近的时间序列进行
部分周期模式挖掘文中增量式的在线挖掘算法对指定时间窗口中的数据搜索不多于 次分别对合成时间序列和交通
流时间序列数据进行了实验数据表明与不带移动窗的现有算法相比搜索速度大大加快该算法对大型时间序列数据
非常有效
关键词时间序列部分周期模式移动窗频繁模式
中图分类号TP 文献标识码A文章编号
Partial periodic pattern updating technology in time series databases
WANG Xiaoye
XIAO yingyuan
ZHANG Degan
Tianjin Key Laboratory of Intelligence Computing and Novel Software Technology Tianjin University of Technology Tianjin Chi
na Key Laboratory of Computer Vision and SystemTianjin University of Technology Tianjin China
AbstractIn order to solve the problem of high complexity in the computation of the online incremental partial pe
riodic pattern mining this paper presented mining technology from a time series database based on a movingwin
dowIn the process of data mining in time series in some scenarios it is only necessary to mine the partial period
ic patterns in the recent time series databases in order to forecast the future action trend in time seriesTherefore
during the mining it needs to mine the partial periodic patterns in the recent time series databases using time win
dow based on the former mining resultsThe proposed incremental online mining algorithm can focus the discovery
on the recent data using a movingwindow which only needs to scan the data set in the specified time window two
times at mostThe algorithm was demonstrated in synthetic time series databases and the traffic time series databas
esThe experimental results show that the new algorithm has a higher computing efficiency than the nonmoving
window algorithm in many aspects for large databases
Keywordstime series partial periodic pattern movingwindow frequency pattern
收稿日期
基金项目国家自然基金资助项目
作者简介王晓晔 女副教授博士jiaoliucom
通信作者王晓晔
时间序列部分周期模式的挖掘是一类重要的数
据挖掘任务在许多场合都有重要的应用如电力负
荷时序数据的高峰期往往具有部分周期性发现这
种周期就可以避开高峰用电减轻电厂的负担
对于时间序列数据挖掘的研究主要集中在相似
性问题和时态模式挖掘的研究
其中相似性问
题研究主要是面向查询的需要
包括各种相似
性搜索算法
的研究时态模式挖掘则主要包括各
种序列的模式挖掘进行时态因果周期模式关联
规则和重要事件的预测
等内容
在时态模式的挖掘方面从时间序列中抽取模
式是一个比较新颖的方向从研究内容来分目前研
究重点主要集中在 个方面对时序中的事件出现
加以模式发现和预测如时态因果和关联规则挖掘
时序数据的周期模式包括全周期模式和部分周期
模式部分周期模式的研究大多采用了 Apriorilike
启发式挖掘算法的思想和理论
由于 Apriorilike 不能发现不同周期之间的模
式和计算复杂度过大等文献 提出了一种对单
周期和多周期都适用的部分周期模式挖掘算法最
大子 模 式 迎 合 树 算 法 the maxsubpattern hit set
treeMht但是该算法只能对现有时间序列数据库