无界损失函数下训练误差分布对泛化性能的深度分析 - CSDN文库

需积分: 9 68 浏览量更新于2024-09-06 收藏 517KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

资源详情

资源推荐

http://www.paper.edu.cn

- 3 -

中国科技论文在线

依至少

1





的概率成立。其中





,

,

sup

,

p

p

z

EQ z

EQ z











。



表示整体样本空间预测误差的峰度，



,

p

p

EQ z



为





,Qz



的

p

阶矩，

p

为整数。

不等式错误！未找到引用源。和错误！未找到引用源。的右端代表结构风险。如果提供75

一个容许结构，然后在整个给定的结构元素即容许函数集



上就可找到最小化保证风险（即

式错误！未找到引用源。和错误！未找到引用源。）的函数

f

。其中，容许结构是依据 VC

维

h

、有界损失函数集的上界

B

或无界损失函数集的峰度



等几个影响泛化性能的重要因素

的大小次序，将函数空间

 分割成一个个函数子集

12

...

n

SS S

而构成的函数空间拓

扑结构。 80

文献

[3]

指出，经验风险是训练样本预测误差的平均值。然而，当函数确定后，对于给定

的样本数据集来说，训练样本的预测误差在整体样本空间中并不全是大概率事件，这时在经

验风险中平等对待这些样本是不正确的，所以在分析风险界时，应该考虑训练误差概率分布

的尾部厚度。从统计学理论得知峰度



是描述概率分布尾部厚重程度的理想统计量，然而它

只适用于高价值数据，对于低价值甚至小样本数据集来说峰度



并不合适。为此，我们首先85

将这些训练样本的预测误差按其大小进行排序，然后重新讨论经验风险与结构风险。

以无界非负损失函数集中的任意损失函数





,Qz



为例，将样本依据其损失函数



,Qz



即预测误差大小，得到一个正序序列

12

, ,..., ,...,

i

zz z z



，再以



,

k

Qz



作为阈值，

将上述序列分为两个部分，一个是非极端值部分





11

,... ,...,

ik

zz z



，另一个是极端值部分



,..., ,...,

ki

zzz



。前者描述了误差分布中的大概率情况；后者描述了小概率情况。下面从90

定理 1 来讨论无界非负损失函数集合中一般情况下的结构风险问题。

定理 1 设无界非负损失函数集为

(, ),Qz









，

()Fz

为样本

z

的分布函数，



2

S

ann

H  为

函数集合



在



个样本中的退火熵，则不等式







1

2

1

(, ) () ( , )

sup

(, ) ()

1

min

21

2

4exp

42 1

i

i

S

ann

Qz dFz Qz

P

Qz dFz

Hk

k

kk



































































































(3)

成立，其中



11

(,)ln(,)ln(,)

kik

ik

Qz Qz Qz















。 95

令不等式(3)的右端等于



，可得

剩余12页未读，继续阅读

weixin_39841882

粉丝: 444
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈