神经网络方法课程报告 吴强 200820901021
浅析主成分分析方法
简介
成分分析(PCA)是现代数据分析方法的支柱,它就像一个黑箱被广泛地运用在各个
领域,在本文中本人将谈谈对主成分分析的认识,对 PCA 数据压缩,去噪的应用的理解,
以及 PCA 局限性和其在脑电分类问题的实际应用中的问题,最后简单分析了在 EEG/fMRI
同步采集信号时利用 PCA 去噪可能存在的问题。
虚拟实验例子
这里我首先举一个主成分分析的虚拟实验作为例子,以便能更好地,更直观地理解
PCA。
虚拟实验模型如下图所示,下图中的红球的运动是我们要考察或者说是观测的对象,
而红球被通过一个弹簧连接到固定的墙上,红球做沿弹簧径向的反复震动,下图中就是 X
轴方向,当然由于各种外界因素的干扰影响,如摩擦,碰撞,弹簧的非理想结构,使得红
球的运动方向除了沿弹簧径向方向外还有在其他方向具有不确定性的运动。
为了观测红球的运动,虚拟实验中设计了三个摄像头 A/B/C,从不同角度来记录红球
的运动,而虚拟实验的目的就是通过三个摄像头 A/B/C 的观测数据找出红球的最主要的运
动方向,即沿弹簧径向的运动的 X 轴方向。
这里根据应用 PCA 分析的常见的实际情况,有以下假设:
1) 摄像头只能观测到红球在其二维坐标中的坐标位置。
2) 假设弹簧对于摄像头是不可见的。
3) 除红球摄像头的位置坐标,X/Y/Z 坐标系是未知的且不可直接观测的。
4) 三个摄像头 A/B/C 的相对位置,拍摄方向未知
如果有一个问题:红球到底是沿什么方向的弹簧驱动的?
现在可能有人会说,红球主要的运动方向不是显而易见的吗?一眼就可以看出来!当
然由于人眼的立体视觉,如果在现实中重现该实验确实能一眼就搞定。但是请问如果是超
过三维的高维空间呢?实际上一般每个传感器能观测采样到的往往是一维时间序列数据,
而由这样多个传感器采样数据构成的多维观测数据矩阵,给你这样一个矩阵你又如何能“看
出”如本虚拟实验中的红球的弹簧弹性震动的运动方向?
所以要解决这个问题,我们就可以运用 PCA 分析方法。通过 PCA 就可以从三个摄像
头的观测数据中分析出红球的本征弹性震动,即沿着弹簧方向的运动,从数学的角度说就
是找到在由 A/B/C 三个摄像头所记录数据构成的空间中,找到 X 轴方向的坐标表示,即给
空间中的一个向量。