维普资讯 http://www.cqvip.com
第
26
卷第
4
期
2
∞
6
年
4
月
计算机应用
Computer
Applications
Vol.
26
No.4
Apr.
2006
文章编号
:1001
-9081(2006)04
-0888
-03
基于序列分解的复杂系统的时序预测方法
韩雪梅,徐从富,比慧峰
(浙江大学计算机科学与技术学院,浙江杭州
310027)
(
zjuwendy@
yahoo.
com.
cn)
摘
要:现实中的时序数据,往往取自于复杂草统,表现出长记忆效应与短时不规则注动同时并
存。传统的时序数据的分析和预测方法一般对不同层次的影响不加以区分,而是为其建立一个统一
的模型,这使得在对复杂系统,建模时需要用大量的参数于以在征,影响预测赴率与精度。为此采用新
的方法,将序列数据本身进行多平滑因于分解,对分解后的序列进行多尺度的来样并分别建模、预圳,
最后将结果整合。该方法应用于股票的实验表明,即使对起伏波动很大的时间序列,也能够得到较好
的预测结果。
关键词:复杂草统;时间序列预测;多尺度来样;序列分解
中固分类号:
TP182
文献标识码
:A
New time series forecasting approach for
complex systems based on series decomposing
HAN
Xue-mei
,
XU
Cong-fu
,
SHEN
Hui-feng
(
College
of
Computer
Science
,Zhejiang
Unîversî
¥
y
,
Hangzhou
Zhejiang 310027 , China)
Abstract: Time series are often produced in complex systems
which
are controlled both
by
macroscopic level and
microscopic level
laws
,
with
long
memory
effect and short-term irregularly fluctuations
co
四
sting
in the same series.
Traditional analysis and forecasting methods didn't distinguish these m
tÙ
ti-level influences and always made a single
model
for
predication , which had
to
introduce a lot of
p
盯
ameters
to
describe the characteristics
of
∞
mplex
systems and res
tÙ
t in the loss
of
efficiency and accuracy. However ,
we
decomposed time series into several ones with different
sm
∞
thness
,
all the sub-time
series
were
respectively modeled and predicated
with
multi-scale sampling. Then the forecasting res
tÙ
ts
of
sub-time series
were
composed
to
get
the res
tÙ
t
of
the original time series.
Th
e experiment res
tÙ
ts
on
the stock forecasting
show
that the
method
is
efficient
, even
for
the time series with large fluctuations.
Key words: complex systems; time series forecastingi multi-scale samplingi time series decomposing
0
引言
时间序列是常见的数据类型,对其的分析与预测常常关
系到经挤决策、灾害预防、疾病控制等诸多生产生活领域,是
数据挖掘与知识发现的重要研究问题之一。
现实世界常见的时间序列数据,往往来自于各种复杂系
统,如金融数据、气象数据等,它们受着宏观、中观、微观等不
同居吹困素的影响,其特点是具有大的偶然性与随机性。对
复杂系统的结构剖析历来被统计学、经济学、数学等领域所关
注。经济学普遍认为时间序列曲线,包含了长期的趋势、周期
变化、季节性变化和不规则变化
[1]
0
1951
年,文献
[2J
在对水
文数据的研究中发现了时间序列所具有的长记忆性特征,第
一次提出了时间序列长记忆性的问题。然后,人们发现长记
忆现象在时序数据中是普遍存在的[叫。同时,在
1956
年,文
献
[4J
提出了短范围相依过程的榄念。短范围相依过程度应
了时间序列的强混合性和短记忆的特点。
国内外研究者已经提出了众多时序预测的方法,如
Box
Jenkins[
町,神经网络方法
[6.
汀,遗传算法
[8]
和卡尔曼滤世方
收稿日期
:2005
-10
-
10;
修订日期
:2
∞
5-12-13
法[町等。这些方法在对复杂系统的建模时往往建立一个模
型,通过复杂参数来表征模型特征,对建模之前的预处理却鲜
有研究。然而,对于复杂系统的序列数据,不同层次的外界因
素造成系统既存在长期稳定的趋势,又有短期波动,用一个模
型来刻画往往在敢率与精度上难以两全:丢弃大量对预测时刻
有影响的历史数据进行预测,会降低预测精度;而将历史数据
赋予同样的权重去处理,又会增加计算时间,降低预测效率。
本文研究的时序数据受到宏观、中观、做观多层吹因素约
束,在分析与预测时也相应地果用多层段、多尺度的建模思想
与方法。将时间序列分解为多个序列的"加和",对各个序列
进行不同频度的果样,分别建立预测模型,并以金融数据为倒
进行了分析与预测。实验表明,该方法性能优越,对复杂系统
拟合得较好,具有较高的预测精度。
l
序列预处理
复杂系统的观测数据往往受到从宏观到微观不同层次的
因素约束,这些因素对序列被动的影响时间长短不同。有些
因素会影响序列擅长的世动,例如股票的内在价值机制是股
基金项目:国家自然科学基金资助项目
(60402010)
;航天基金资助项目
(No.
2003-
田二
1J
DX-13
)
作者简介:韩雪梅
(1978-)
,女,硕士研究生,主要研究方向:数据挖掘
i
徐从富
(1969
- )
,男,副教授,博士,主要研究方向:人工智能、数
据挖掘、数据融合;
沈慧峰
υ978
- )
,男,硕士研究生,主要研究方向:数据挖掘,信息融合.
飞