http://www.paper.edu.cn
- 3 -
中国科技论文在线
依至少
1
的概率成立。其中
,
,
sup
,
p
p
z
EQ z
EQ z
。
表示整体样本空间预测误差的峰度,
,
p
p
EQ z
为
,Qz
的
p
阶矩,
p
为整数。
不等式错误!未找到引用源。和错误!未找到引用源。的右端代表结构风险。如果提供75
一个容许结构,然后在整个给定的结构元素即容许函数集
上就可找到最小化保证风险(即
式错误!未找到引用源。和错误!未找到引用源。)的函数
。其中,容许结构是依据 VC
维
h
、有界损失函数集的上界
B
或无界损失函数集的峰度
等几个影响泛化性能的重要因素
的大小次序,将函数空间
分割成一个个函数子集
12
...
n
SS S
而构成的函数空间拓
扑结构。 80
文献
[3]
指出,经验风险是训练样本预测误差的平均值。然而,当函数确定后,对于给定
的样本数据集来说,训练样本的预测误差在整体样本空间中并不全是大概率事件,这时在经
验风险中平等对待这些样本是不正确的,所以在分析风险界时,应该考虑训练误差概率分布
的尾部厚度。从统计学理论得知峰度
是描述概率分布尾部厚重程度的理想统计量,然而它
只适用于高价值数据,对于低价值甚至小样本数据集来说峰度
并不合适。为此,我们首先85
将这些训练样本的预测误差按其大小进行排序,然后重新讨论经验风险与结构风险。
以无界非负损失函数集中的任意损失函数
,Qz
为例,将样本依据其损失函数
,Qz
即预测误差大小,得到一个正序序列
12
, ,..., ,...,
i
zz z z
,再以
,
k
Qz
作为阈值,
将上述序列分为两个部分,一个是非极端值部分
11
,... ,...,
ik
zz z
,另一个是极端值部分
,..., ,...,
ki
zzz
。前者描述了误差分布中的大概率情况;后者描述了小概率情况。下面从90
定理 1 来讨论无界非负损失函数集合中一般情况下的结构风险问题。
定理 1 设无界非负损失函数集为
(, ),Qz
,
()Fz
为样本
z
的分布函数,
2
S
ann
H 为
函数集合
在
个样本中的退火熵,则不等式
1
2
1
(, ) () ( , )
sup
(, ) ()
1
min
21
2
4exp
42 1
i
i
S
ann
Qz dFz Qz
P
Qz dFz
Hk
k
kk
(3)
成立,其中
11
(,)ln(,)ln(,)
kik
ik
Qz Qz Qz
。 95
令不等式(3)的右端等于
,可得