给出线性判别分析算法中的投影向量推导过程,并给出一种投影后数据的分界面表达式
时间: 2024-05-24 08:13:10 浏览: 70
线性判别分析算法的投影向量推导过程如下:
1. 计算各类别样本的均值向量 $m_i$,总体均值向量 $m$,以及类内散布矩阵 $S_w$ 和类间散布矩阵 $S_b$。
2. 计算广义特征值问题 $S_w^{-1}S_b \mathbf{w} = \lambda \mathbf{w}$ 的特征向量 $\mathbf{w}$ 和对应的特征值 $\lambda$。
3. 对特征向量进行归一化处理,得到投影向量。
投影后数据的分界面表达式为:
$y(\mathbf{x}) = \mathbf{w}^T\mathbf{x}$
其中,$\mathbf{w}$ 为投影向量,$\mathbf{x}$ 为待分类样本向量,$y(\mathbf{x})$ 为分类决策函数,当 $y(\mathbf{x}) > \theta$ 时,将 $\mathbf{x}$ 分类为正类,否则分类为负类。其中,$\theta$ 为决策阈值,可以通过训练数据确定。
相关问题
给出线性判别分析算法中的投影向量推导过程,并给出一种投影后数据的分界面表达式?
线性判别分析算法中的投影向量推导过程如下:
1. 计算每个类别的均值向量(mean vector)。
2. 计算总体内散度矩阵(within-class scatter matrix):
$S_W = \sum_{i=1}^{c} \sum_{x\in X_i} (x - \mu_i) (x - \mu_i)^T$
其中,$c$ 表示类别数,$X_i$ 表示第 $i$ 个类别的样本集合,$\mu_i$ 表示第 $i$ 个类别的均值向量。
3. 计算总体间散度矩阵(between-class scatter matrix):
$S_B = \sum_{i=1}^{c} N_i (\mu_i - \mu) (\mu_i - \mu)^T$
其中,$N_i$ 表示第 $i$ 个类别的样本数量,$\mu$ 表示总体的均值向量,$\mu = \frac{1}{n} \sum_{i=1}^{n} x_i$,$n$ 表示总体样本数量。
4. 计算投影向量 $w$:
$w = S_W^{-1} (\mu_1 - \mu_2)$
其中,$S_W^{-1}$ 表示总体内散度矩阵的逆矩阵,$\mu_1$ 和 $\mu_2$ 分别表示两个类别的均值向量。
5. 投影后的数据点 $y$ 的坐标为:
$y = w^T x$
其中,$x$ 表示原始数据点的坐标。
6. 分界面表达式为:
$y = w^T x = w^T (\mu_1+\mu_2)/2$
即,投影后的数据点在投影向量上的坐标等于两个类别均值向量的平均值在投影向量上的坐标。对于二分类问题,可以将该分界面作为分类器的决策边界,将投影后的数据点根据它们在分界面上的位置分为两类。
. 给出线性判别分析算法中的投影向量推导过程,并给出一种投影后数据的分界面表达式?
线性判别分析算法的投影向量推导过程如下:
1. 计算每个类别的均值向量:$$ \mu_c = \frac{1}{n_c} \sum_{i=1}^{n_c} \mathbf{x_i^c} $$ 其中,$n_c$ 是类别 $c$ 中样本的个数,$\mathbf{x_i^c}$ 是类别 $c$ 中的第 $i$ 个样本。
2. 计算总体均值向量:$$ \mu = \frac{1}{n} \sum_{i=1}^{n} \mathbf{x_i} $$ 其中,$n$ 是所有样本的个数,$\mathbf{x_i}$ 是第 $i$ 个样本。
3. 计算类内散度矩阵:$$ \mathbf{S_W} = \sum_{c=1}^{C} \sum_{i=1}^{n_c} (\mathbf{x_i^c} - \mu_c) (\mathbf{x_i^c} - \mu_c)^T $$ 其中,$C$ 是类别的个数。
4. 计算类间散度矩阵:$$ \mathbf{S_B} = \sum_{c=1}^{C} n_c (\mu_c - \mu) (\mu_c - \mu)^T $$
5. 计算投影向量:$$ \mathbf{w} = \mathbf{S_W}^{-1} (\mu_1 - \mu_2) $$ 其中,$\mu_1$ 和 $\mu_2$ 是两个类别的均值向量。
投影后数据的分界面表达式可以表示为:$$ \mathbf{w}^T \mathbf{x} = \frac{1}{2} (\mathbf{w}^T \mu_1 + \mathbf{w}^T \mu_2) $$ 如果 $\mathbf{w}^T \mathbf{x} \geq \frac{1}{2} (\mathbf{w}^T \mu_1 + \mathbf{w}^T \mu_2)$,则预测为类别 1;否则预测为类别 2。