判别分析中错判概率的分析与修正策略

需积分: 32 32 浏览量更新于2024-08-12 收藏 59KB PDF 举报

"这篇论文探讨了判别分析中错判概率的问题，并提出了一些修正方法，主要针对两类总体的判别分析。作者分析了错判的原因，包括总体均值的接近和协方差的非齐性，并针对这些因素提出了修正原则。论文通过分析判别函数，特别是马氏距离，来解释如何进行判别决策，并讨论了如何降低错判率。" 在判别分析中，其目标是根据观测数据将样本正确分类。然而，错判现象在实际应用中经常发生，这可能由于两类总体的统计特性相近或者数据的内在复杂性。错判的概率是评估判别模型性能的关键指标，低错判率意味着模型有更高的准确性。首先，错判主要源于两类总体的均值相近。当两类总体在各个特征上的均值差异不大时，判别模型可能会遇到困难，因为难以区分它们。为了减轻这个问题，可以使用加权判别方法，考虑每个特征的重要性，或者使用更复杂的模型来捕捉更精细的差异。其次，协方差的非齐性也是导致错判的一个重要因素。如果两类总体的协方差矩阵不相等，即各特征之间的相关性在不同类中存在差异，那么简单的距离度量可能会失效。为了解决这个问题，论文中提到了马氏距离，它考虑了协方差的影响，可以消除因特征相关性不同导致的错判。马氏距离定义为样本点与类中心之间的距离，经过协方差矩阵的逆运算，能更好地反映类间的相对位置。判别函数W在马氏距离的基础上构建，用于决定样本应该归属的类别。如果W小于零，样本被归入第一类；若W大于零，则归入第二类；而W等于零时，样本归属不确定。这个函数是基于样本点X与两类平均值X1和X2之间的距离差，通过Vw，即加权的合并协方差矩阵，进行调整。论文还讨论了如何通过调整和优化判别准则来减少错判率。这可能包括选择更适合的统计模型，改进数据预处理步骤，如标准化或主成分分析，以及采用更复杂的判别方法，如贝叶斯判别或支持向量机。判别分析中的错判概率是一个核心问题，通过理解错判来源并采取适当的修正策略，可以提高分类的准确性和可靠性。李晓毅和徐兆棣的论文提供了深入的分析和实用的建议，对于理解和改进判别分析的实践具有重要意义。

收稿日期：２００６－０３－２２

作者简介： 李晓毅（１９５６－），女，辽宁葫芦岛人，沈阳师范大学副教授

第２５卷　第２期

２００７年４月

沈阳师范大学学报（自然科学版）

Journal of Shenyang Normal University （ Natural Science）

Vol．２５， No．２

Apr ．２００７

文章编号：１６７３－５８６２（２００７）０２－０１４６－０４

判别分析中错判的概率及修正

李晓毅，徐兆棣

（沈阳师范大学数学与系统科学学院统计学系，辽宁沈阳　１１００３４）

摘　　　要：在判别分析中，无论采用那种判别方法，错判是不可避免的

错判的来源主要有２方

面，一是各类总体的均值相近，另一是各总体的协方差的非齐性，针对各种原因给出相应的修正原

则和方法

关　键　词：判别分析；错判概率；修正

中图分类号： O ２１２　　　文献标识码： A

０　引　　言

判别分析是判别样品所属类型的一种有效方法，其应用日益广泛

判别分析的内容非常丰富，方法

很多

［１］

，无论是那种判别方法，都不可避免地会出现错判问题，不同的判别方法，错判概率有所不同

［２］

，

使得判别的有效性大打折扣

错判概率的大小是衡量判别效果的重要指标

文中对错判概率进行了分析

讨论，找出影响错判概率的主要因素，针对各因素给出相应的修正原则和方法

１　判别分析的原理

判别分析中最基本的判别是两个总体的距离判别，本文以此种判别方法为研究对象，设有两个总体

（或称２类） G

１

， G

２

，从第一个总体中抽取 n

１

个样本，从第二个总体中抽取 n

２

个样本，每个样本测量 m

个指标 x

１

， x

２

，…， x

，所得数据集称为训练样本

今任取一个样品 X，实测指标值 X ＝（ x

１

， x

２

，…，

），该样品应判归为哪一类？首先计算样品到２类 G

１

、G

２

的距离，分别记为 D（ X， G

１

）和 D（ X，

２

），按照距离最近准则判别归类，判别准则为

X ∈ G

１

，如果 W ＜０，

X ∈ G

２

，如果 W ＞０，

X 待判，如果 W ＝０

其中， W ＝ D（ X， G

１

）－ D（ X， G

２

）为判别函数

上式中距离的定义很多，都可以酌情选用，通常选用马

氏距离，此时判别函数为

W ＝（ X －　X

） V

－１

（　X

２

－　X

１

）′ （１）

其中，　X

＝（　X

１

＋　X

２

）／２， V

＝

（ n

１

－１） V

１

＋（ n

２

－１） V

２

n１＋ n２－２

为２类协方差矩阵的（加权）合并协方差矩

阵， V

－１

为其逆矩阵，　X

、V

为第 k 类的重心和协方差（ k ＝１，２）

２　错判的概率及因素

为讨论方便，先考虑取 m ＝１的单变量情形，设两个总体分别来自方差相等的两个正态分布 N

（μ

１

，σ

２

）， N（μ

２

，σ

２

），则判别函数（１）简化为

W ＝（ X － μ

）

１

２

（μ

２

－ μ

１

）′ （２）

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38690095

粉丝: 4
资源: 914

判别分析中错判概率的分析与修正策略

SAS软件应用之判别分析.ppt

SAS软件应用之判别分析ppt课件.ppt

R语言中混淆矩阵和错判率怎么计算

matlab 小波变换后怎么提取心电信号的p波

信号检测与估计理论 赵树杰答案 csdn

互联网金融存在的信用风险问题展开分析

最新资源

信号检测与估计理论赵树杰答案 csdn