投影算子与正则化最小二乘回归的理论研究

需积分: 13 53 浏览量更新于2024-08-12 收藏 209KB PDF 举报

"这篇论文是2012年由杨运中和冯云龙共同发表的，探讨了基于投影算子的正则化最小二乘回归算法。研究利用经验覆盖数和投影算子来理论分析该算法，简化了回归分析过程，并提升了误差收敛速度，达到了O(m-1)型的收敛阶，这是统计学习理论中泛化误差的最优逼近阶。论文发表在《武汉大学学报（理学版）》第58卷第2期。" 正文: 本文主要关注的是正则化最小二乘回归的学习算法，特别是在引入投影算子和经验覆盖数概念后对算法性能的改进。正则化最小二乘回归是一种广泛应用的统计学习方法，它在处理过拟合问题时表现出色，通过在目标函数中添加正则项来限制模型复杂度。然而，传统的实现方式可能会导致复杂的计算过程。经验覆盖数（empirical covering number）是统计学习理论中的一个重要概念，它用于量化一个集合的复杂性。在学习算法中，经验覆盖数可以帮助我们理解和控制模型的泛化能力。论文中，作者将经验覆盖数引入到正则化最小二乘回归的分析中，这有助于更精确地估计算法的性能和泛化误差。投影算子(projection operator)在数学和信号处理中有着广泛的应用，它能够将向量映射到某个特定空间的子集。在机器学习中，投影算子被用来简化问题的维度，减少计算复杂性，并保持数据的主要特性。在正则化最小二乘回归中，通过使用投影算子，作者不仅简化了回归分析的步骤，还提高了算法的效率。论文的核心贡献在于展示了如何通过投影算子将最小二乘回归的误差收敛阶提升到O(m-1)型。这个收敛阶表明，随着训练样本数量m的增加，算法的泛化误差将以更快的速度减小，这是统计学习理论中关于泛化误差的最佳逼近阶。这一发现对于实际应用具有重要意义，因为更快的收敛速度意味着模型可以在更少的训练数据上达到较好的预测效果，节省了计算资源和时间。此外，论文还强调了这种方法对于实际数据挖掘和机器学习研究的价值。通过简化回归分析流程并提高算法的泛化性能，基于投影算子的正则化最小二乘回归可以成为处理大规模数据集的有效工具，特别是在有限计算资源的情况下。关键词涉及的学习理论、正则化最小二乘回归、投影算子和经验覆盖数，都是理解和改进机器学习模型的关键元素。这篇论文的工作为这些领域的深入研究提供了新的视角和理论基础，对于后续的研究者来说，是一个有价值的参考来源。

书书书

第

５８

卷第

２

期

２０１２

年

４

月

武汉大学学报（理学版）

Ｊ．ＷｕｈａｎＵｎｉｖ．

（

Ｎａｔ．Ｓｃｉ．Ｅｄ．

）

Ｖｏｌ．５８Ｎｏ．２

Ａ

ｐ

ｒ．２０１２

，

１００

～



１０４

收稿日期：

２０１１０３０４

作者简介：杨运中，男，助教，现从事数据挖掘及机器学习的研究

．

Ｅｍａｉｌ

：

ｙ

ｕｎｚｈｏｎ

ｇｙ

ａｎ

ｇ

＠

ｈｏｔｍａｉｌ．ｃｏｍ

文章编号：

１６７１８８３６

（

２０１２

）

０２０１０００５

基于投影算子的正则化最小二乘回归

杨运中

１

，冯云龙

２

（

１．

南京机电职业技术学院机械工程系，江苏南京

２１１１３５

；

２．

中国科学技术大学



香港城市大学联合高等研究中心，江苏苏州

２１５１２３

）

摘

要：通过引入经验覆盖数（

ｅｍ

ｐ

ｉｒｉｃａｌｃｏｖｅｒｉｎ

ｇ

ｎｕｍｂｅｒ

）和投影算子（

ｐ

ｒｏ

ｊ

ｅｃｔｉｏｎｏ

ｐ

ｅｒａｔｏｒ

），从理论上研究正

则化最小二乘回归学习算法

．

与已有的方法相比，一方面简化了回归分析的过程；另一方面，提高了最小二则回归

学习算法的误差收敛阶

．

即，通过引入投影算子，得到了

Ｏ

（

ｍ

－

１

）

型的收敛阶，这是统计学习理论中关于泛化误差

的最佳逼近阶

．

关

键

词：学习理论；正则化最小二乘回归；投影算子；经验覆盖数

中图分类号：

Ｏ２３４

文献标识码：

Ａ

ＴｈｅＲｅ

ｇ

ｕｌａｒｉｚｅｄＬｅａｓｔＳ

ｑ

ｕａｒｅＲｅ

ｇ

ｒｅｓｓｉｏｎｖｉａｔｈｅＰｒｏ

ｊ

ｅｃｔｉｏｎＯ

ｐ

ｅｒａｔｏｒ

ＹＡＮＧＹｕｎｚｈｏｎ

ｇ

１

，

ＦＥＮＧＹｕｎｌｏｎ

ｇ

２

（

１．Ｄｅ

ｐ

ａｒｔｍｅｎｔｏｆＭｅｃｈａｎｉｃａｌＥｎ

ｇ

ｉｎｅｅｒｉｎ

ｇ

，

Ｎａｎ

ｊ

ｉｎ

ｇ

ＩｎｓｔｉｔｕｔｅｏｆＭｅｃｈａｔｒｏｎｉｃＴｅｃｈｎｏｌｏ

ｇｙ

，

Ｎａｎ

ｊ

ｉｎ

ｇ

２１１１３５

，

Ｊｉａｎ

ｇ

ｓｕ

，

Ｃｈｉｎａ

；

２．ＪｏｉｎｔＡｄｖａｎｃｅｄＲｅｓｅａｒｃｈＣｅｎｔｅｒｏｆＵｎｉｖｅｒｓｉｔ

ｙ

ｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏ

ｇｙ

ｏｆＣｈｉｎａａｎｄ

Ｃｉｔ

ｙ

Ｕｎｉｖｅｒｓｉｔ

ｙ

ｏｆＨｏｎ

ｇ

Ｋｏｎ

ｇ

，

Ｓｕｚｈｏｕ２１５１２３

，

Ｊｉａｎ

ｇ

ｓｕ

，

Ｃｈｉｎａ

）

Ａｂｓｔｒａｃｔ

：

Ｉｎｔｈｉｓ

ｐ

ａ

ｐ

ｅｒ

，

ｗｅｉｎｖｅｓｔｉ

ｇ

ａｔｅｔｈｅｒｅ

ｇ

ｕｌａｒｉｚｅｄｌｅａｓｔｓ

ｑ

ｕａｒｅｒｅ

ｇ

ｒｅｓｓｉｏｎ

ｐ

ｒｏｂｌｅｍｂ

ｙ

ｍａｋｉｎ

ｇ

ｕｓｅｏｆｅｍ

ｐ

ｉｒｉｃａｌ

ｃｏｖｅｒｉｎ

ｇ

ｎｕｍｂｅｒｓａｎｄｔｈｅ

ｐ

ｒｏ

ｊ

ｅｃｔｉｏｎｏ

ｐ

ｅｒａｔｏｒ．Ｌｅａｒｎｉｎ

ｇ

ｒａｔｅｓａｒｅｃｏｎｄｕｃｔｅｄｂａｓｅｄｏｎｔｈｅｓｅｔｅｃｈｎｉ

ｑ

ｕｅｓ．Ｃｏｍ

ｐ

ａｒｉｎ

ｇ

ｗｉｔｈｅｘｉｓｔｉｎ

ｇ

ｒｅｓｕｌｔｓ

，

ｗｅｓｉｍ

ｐ

ｌｉｆ

ｙ

ｔｈｅｔｈｅｏｒｅｔｉｃａｌａｎａｌ

ｙ

ｓｉｓ．Ｍｏｒｅｏｖｅｒ

，

ｌｅａｒｎｉｎ

ｇ

ｒａｔｅｓａｒｅａｌｓｏｉｍ

ｐ

ｒｏｖｅｄｕｎｄｅｒｍｉｌｄｃｏｎ

ｄｉｔｉｏｎｓ．Ｃｏｎｃｒｅｔｅｌ

ｙ

ｓ

ｐ

ｅａｋｉｎ

ｇ

，

ｔｈｅｌｅａｒｎｉｎ

ｇ

ｒａｔｅｓｗｅｏｂｔａｉｎｅｄａｒｅｏｆｔ

ｙｐ

ｅ

Ｏ

（

ｍ

－

１

），

ｗｈｉｃｈａｒｅｒｅ

ｇ

ａｒｄｅｄａｓｔｈｅｏ

ｐ

ｔｉｍａｌ

ｌｅａｒｎｉｎ

ｇ

ｒａｔｅｓｏｎｔｈｅ

ｇ

ｅｎｅｒａｌｉｚａｔｉｏｎｅｒｒｏｒｓｉｎｌｅａｒｎｉｎ

ｇ

ｔｈｅｏｒ

ｙ

ｌｉｔｅｒａｔｕｒｅ．Ｍｅａｎｗｈｉｌｅ

，

ｗｅａｂａｎｄｏｎｔｈｅｗｉｄｅｌ

ｙ

ａｄｏ

ｐ

ｔｅｄｉｔ

ｅｒａｔｉｏｎｍｅｔｈｏｄｓｗｈｅｎｄｅｒｉｖｉｎ

ｇ

ｔｈｅ

ｇ

ｅｎｅｒａｌｉｚａｔｉｏｎｅｒｒｏｒｓ．

Ｋｅ

ｙ

ｗｏｒｄｓ

：

ｌｅａｒｎｉｎ

ｇ

ｔｈｅｏｒ

ｙ

；

ｒｅ

ｇ

ｕｌａｒｉｚｅｄｌｅａｓｔｓ

ｑ

ｕａｒｅｒｅ

ｇ

ｒｅｓｓｉｏｎ

；

ｐ

ｒｏ

ｊ

ｅｃｔｉｏｎｏ

ｐ

ｅｒａｔｏｒ

；

ｅｍ

ｐ

ｉｒｉｃａｌｃｏｖｅｒｉｎ

ｇ

ｎｕｍｂｅｒ

０

引

言

近年来随着统计学习理论研究的深入，正则化

最小二乘回归问题也受到广泛关注

［

１

～

１０

］

并且应用

在各个领域

［

１１

，

１２

］

．

文献［

１０

］以积分算子的特征值衰

减来度量假设空间的容量，研究了无界采样时正则

化最小二乘回归问题

．

文献［

５

］给出了基于容量假

设的回归误差分析，并且通过迭代给出了泛化误差

的收敛阶

．

文献［

３

］针对小样本问题，对于一般的正

则化项分析了最小二乘回归的泛化能力

．

值得注意

的是，在文献［

３

］中推导泛化误差时采用了投影算子

的技巧

．

同时我们也注意到，在考虑系数正则化回

归问题时文献［

２

］通过引入经验覆盖数提高了收敛

阶

．

受此启发，本文通过引入投影算子和经验覆盖

数，对正则化最小二乘回归问题进行理论分析并给

出误差收敛阶

．

考虑输入空间为紧度量空间

Ｘ

并设其上的度

量为

ｄ

，输出空间

Ｙ

＝Ｒ．

令

是定义在

Ｚ

∶＝

Ｘ

Ｙ

上的概率分布

．

对于

ｆ

：

→

Ｙ

，定义其泛化误差

（

ｇ

ｅｎｅｒａｌｉｚａｔｉｏｎｅｒｒｏｒ

）为：

（

ｆ

）

＝

∫

Ｚ

（

ｆ

（

ｘ

）

－

ｙ

）

２

ｄ

（

１

）

使（

１

）式取得最小值的函数我们定义为回归函数

ｆ

，由基本的统计知识有：

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38571449

粉丝: 5
资源: 944

投影算子与正则化最小二乘回归的理论研究

Matlab实现偏最小二乘回归模型及详细说明

偏最小二乘回归（PLSR）原理与PCA回顾

科技投入对经济产出：偏最小二乘回归模型的应用与策略建议

基于局部补丁的正则化最小二乘模型，用于压缩伪像的去除

正则化最小二乘的正交局部保持判别投影的人脸识别.pdf

超分辨率重建结合正则化最小二乘的人脸识别方法.pdf

Shotgun 是一种 C++ 并行坐标下降算法，用于解决 L1 正则化最小二乘和逻辑回归问题_C++代码_下载

基于正则化加权最小二乘框架的低对比度超声层析成像图像重建

偏最小二乘的回归拟合，基于MATLAB的偏最小二乘回归拟合，pls回归拟合

Partial Least Squares Regression_回归_偏最小二乘_偏最小二乘回归算法_最小二乘回归.zip

最新资源