最大类间方差中的类间方差怎么计算
时间: 2024-02-05 19:04:07 浏览: 90
max_sigma.rar_最大类间方差
最大类间方差(Maximal Interclass Variance,MIV)是一种常用的分类方法,用于确定最佳的分类阈值。其计算步骤如下:
1. 计算整个数据集的均值。
2. 对数据集进行分类,将其分成两个子集:一个包含所有小于等于阈值的样本,另一个包含所有大于阈值的样本。
3. 计算两个子集的均值。
4. 计算两个子集的方差之和,即为类间方差。
5. 重复步骤2-4,找到使类间方差最大的阈值。
例如,对于一个包含10个样本的数据集,其样本值如下:
1,2,3,4,5,6,7,8,9,10
首先计算整个数据集的均值:
mean = (1+2+3+4+5+6+7+8+9+10) / 10 = 5.5
然后对数据集进行分类,假设阈值为5,将数据集分成两个子集:
子集1:1,2,3,4,5
子集2:6,7,8,9,10
分别计算两个子集的均值:
mean1 = (1+2+3+4+5) / 5 = 3
mean2 = (6+7+8+9+10) / 5 = 8
计算两个子集的方差:
var1 = ((1-3)^2+(2-3)^2+(3-3)^2+(4-3)^2+(5-3)^2) / 4 = 2.5
var2 = ((6-8)^2+(7-8)^2+(8-8)^2+(9-8)^2+(10-8)^2) / 4 = 2.5
类间方差为:
var_between = 5 * ((3-5.5)^2 + (8-5.5)^2) = 50
重复上述步骤,找到使类间方差最大的阈值,即为最大类间方差。
阅读全文