偏最小二乘回归（PLSR）原理与PCA回顾

需积分: 9 136 浏览量更新于2024-09-13 收藏 780KB PDF 举报

"偏最小二乘回归是一种统计分析方法，旨在解决线性回归中的问题，特别是在样本数较少而特征较多，或特征之间存在线性相关性时。它结合了主成分分析（PCA）和线性回归，通过降维来提高模型的解释性和预测能力。本文将简要介绍偏最小二乘回归的基本思想。 1. 偏最小二乘回归（PLSR）的背景线性回归在处理高维数据时可能会遇到困难，例如当样本数m小于特征数n时，导致系数矩阵XTX不可逆，从而无法应用最小二乘法求解。为了解决这一问题，偏最小二乘回归应运而生。 2. 主成分回归（PCR）与PCA 在进行偏最小二乘回归之前，我们首先回顾主成分分析（PCA）。PCA通过对原始数据进行变换，提取出最重要的特征向量，即主成分，用于降维。PCA的目标是找到一个正交基，使样本在新坐标系下的方差最大化。当X的协方差矩阵的秩小于n时，可以使用PCA投影X到一个低维空间，得到新矩阵T，此时XTX可逆，可以进行最小二乘回归，这种方法称为主成分回归。 3. PCA的数学表述 PCA通常表示为XT = TP，其中X是样本矩阵，P是协方差矩阵的特征向量矩阵，T是X在P所定义的正交子空间上的投影，即降维后的样本矩阵。P的列向量是正交的，因为XTX的特征向量矩阵P是正交的，这确保了T的列向量也是正交的。通过PCA，可以将X转换为具有正交属性的T，从而解决最小二乘法在高维空间中的问题。 4. 偏最小二乘回归（PLSR）的核心 PLSR进一步改进了PCR，不仅考虑了数据的降维，还考虑了响应变量（y）的影响。在PCA的基础上，PLS寻找与y关联最强的主成分，而不是单纯追求方差最大化。通过构建解释变量（X）和响应变量（y）之间的关系，PLS可以同时优化解释变量的降维和回归模型的预测性能。 5. PLSR的步骤 - 首先，对X和y进行中心化处理，使得它们的均值为零。 - 然后，使用PLS算法逐步构建一系列的主成分（或称为载荷向量），每个主成分尽可能多地解释X和y之间的共同变异。 - 在每一步中，都会找到一个新的载荷向量，这个向量既与X相关，又与y相关，这样就构建了X和y之间的联合模型。 - 最终，通过这些载荷向量，可以构建出一个低维的X'，并用最小二乘法在X'上建立回归模型。 6. 应用与优势 PLSR在化学、生物、社会科学等领域有广泛应用，如化学计量学中的光谱分析，基因表达数据分析等。其优势在于能有效处理多重共线性，减少过拟合风险，同时提供对数据结构的直观理解。总结，偏最小二乘回归是一种强大的工具，它结合了主成分分析的降维能力和线性回归的预测能力，特别适合于处理高维、多相关性的数据集，能够提高模型的解释性和预测精度。"

偏最小二乘法回归（Partial Least Squares Regression）

JerryLead@ISCAS

csxulijie@gmail.com

2011 年 8 月 20 日星期六

1. 问题

这节我们请出最后的有关成分分析和回归的神器 PLSR。PLSR 感觉已经把成分分析和回

归发挥到极致了，下面主要介绍其思想而非完整的教程。让我们回顾一下最早的 Linear

Regression 的缺点：如果样例数 m 相比特征数 n 少（m<n）或者特征间线性相关时，由于





（n*n 矩阵）的秩小于特征个数（即



不可逆）。因此最小二乘法󰇛



󰇜







 就会失

效。

为了解决这个问题，我们会使用 PCA 对样本 X（m*n 矩阵）进行降维，不妨称降维后的

X 为 X’（m*r 矩阵，一般加了’就表示转置，这里临时改变下），那么 X’的秩为 r（列不相关）。

2. PCA Revisited

所谓磨刀不误砍柴工，这里先回顾下 PCA。

令 X 表示样本，含有 m 个样例󰇝

󰇛



󰇜



󰇛



󰇜



󰇛



󰇜

󰇞，每个样例特征维度为 n ，



󰇛



󰇜

󰇝



󰇛



󰇜





󰇛



󰇜





󰇛



󰇜

󰇞。假设我们已经做了每个特征均值为 0 处理。

如果 X 的秩小于 n，那么 X 的协方差矩阵









的秩小于 n，因此直接使用线性回归的

话不能使用最小二乘法来求解出唯一的，我们想使用 PCA 来使得



可逆，这样就可以用

最小二乘法来进行回归了，这样的回归称为主元回归（PCR）。

PCA 的一种表示形式：



其中 X 是样本矩阵，P 是 X 的协方差矩阵的特征向量（当然是按照特征值排序后选取的

前 r 个特征向量），T 是 X 在由 P 形成的新的正交子空间上的投影（也是样本 X 降维后的新

矩阵）。

在线性代数里面我们知道，实对称阵 A 一定存在正交阵 P，使得



为对角阵。因此

可以让



的特征向量矩阵 P 是正交的。

下载后可阅读完整内容，剩余5页未读，立即下载

none2null

粉丝: 0
资源: 1

偏最小二乘回归（PLSR）原理与PCA回顾

偏最小二乘回归模型内涵分析方法研究

偏最小二乘回归方法 python代码

偏最小二乘回归代码.rar_lni_偏最小二乘_偏最小二乘回归代码MATLAB_回归

第三十章 偏最小二乘回归.rar_PLS回归_pls_偏最小二乘_偏最小二乘回归_回归

Partial Least Squares Regression_回归_偏最小二乘_偏最小二乘回归算法_最小二乘回归.zip

Partial Least Squares Regression_回归_偏最小二乘_偏最小二乘回归算法_最小二乘回归_源码.zi

偏最小二乘法_偏最小二乘回归_偏最小二乘_plsr_偏最小二乘法_

偏最小二乘的回归拟合，基于MATLAB的偏最小二乘回归拟合，pls回归拟合

偏最小二乘回归程序MATLAB.rar_偏最小二乘_光谱回归预测_光谱处理_光谱数据 MATLAB_光谱数据处理

偏最小二乘回归算法

最新资源

第三十章偏最小二乘回归.rar_PLS回归_pls_偏最小二乘_偏最小二乘回归_回归