Fisher线性判别法与机器学习模型评估

需积分: 0 10 浏览量更新于2024-08-04 收藏 1.42MB DOCX 举报

"PRML_2018-2019-郭立东1" 本文主要探讨了机器学习和统计模式识别中的几个关键概念，包括Fisher线性判别分析、贝叶斯决策理论、过拟合与欠拟合的识别以及模型优化策略。以下是对这些知识点的详细阐述： **Fisher线性判别方法**是用于分类的一种方法，旨在寻找一个投影方向，使投影后的样本类别间差异最大化，同时类别内部的差异最小化。基本思想是找到一个投影向量**w**，使得类间散度（Sb）与类内散度（Sw）之比最大。准则函数通常表示为**w**的范数与类间散度矩阵与类内散度矩阵之差的乘积的比值。对于2类问题，解可以通过求解Sw的逆矩阵与Sb的乘积的特征向量得到，即**w** = (Sw)^(-1)Sb。 **最小错误率的贝叶斯决策**涉及到基于先验概率和似然概率的最优决策规则。决策函数根据样本特征值与决策面的关系来确定，如题干所示，通过比较两种可能的决策带来的误判概率来决定最佳决策。 **最小风险贝叶斯决策**进一步考虑了决策的风险，不仅考虑误判概率，还考虑了误判带来的损失。决策函数同样基于样本特征值和风险矩阵，通过比较不同决策的风险来确定。 **K-L变换**（Kullback-Leibler Divergence）是无监督学习中衡量两个概率分布差异的度量，此处提及它满足最佳K-L变换的需求，但未详细展开。过拟合和欠拟合是模型训练中的常见问题。**过拟合**发生时，模型在训练集上表现优秀，但在未知数据（测试集）上表现较差，通常是由于模型过于复杂。而**欠拟合**则是模型过于简单，无法捕捉数据的复杂性，无论在训练集还是测试集上表现都不理想。通过绘制模型复杂度-错误率曲线，可以判断模型是否过拟合或欠拟合，并采取相应的优化措施，如正则化、增加数据量、使用集成学习等。最后，文章提到了两种目标检测算法：**YOLO**（You Only Look Once）和**SSD**（Single Shot MultiBox Detector）。YOLO将图像划分为网格，每个网格预测物体边界框的概率；SSD采用锚点（Anchor）机制，针对不同尺寸和比例的物体，提出多个潜在边界框。该文涵盖了机器学习中的基础理论和实际应用，包括分类、决策理论以及模型评估和优化。

i. （10 分）简述 Fisher 线性判别方法的基本思路，写出准则函数和对应的解。

1) Fisher 线性判别方法的基本思路：为了将

维空间内的样本投影到 1 维空间并且尽

量保留可分性，Fisher 线性判别方法的基本思路是：选择最佳投影方向

∗

，使得投

影后各类样本内部尽量密集（也就是“类内散度”小），各类均值之差越大越好（也

就是“类间散度“大）。

2) 准则函数（2 类问题）：

(

𝐹

)

(

𝑚

―

𝑚

)

𝑆

𝑤

𝑇

𝑏

𝑤

𝑇

𝑤

其中，

(

𝑚

―

𝑚

)

是投影后的两类均值之差；

𝑆

𝑖

是投影后的样本类内离散度；



𝑆

𝑖

∑

∈

𝛤

𝑖

(

―

𝑚

𝑖

)

这是个标量，因为

是一维标量。

是投影方向；

为样本类间离散度矩阵；



𝑆

(

𝑚

―

𝑚

)(

𝑚

―

𝑚

)

𝑇

为总样本类内离散度矩阵；



𝑖

𝑥

∈

𝛤

𝑖

(𝑥

―

𝑚

𝑖

)(𝑥

―

𝑚

𝑖

)

𝑇

, 𝑖

1 , 2



𝑆

𝑤

𝑆

3) 解（2 类问题）：

―

𝑤

𝑆

𝑤

∗

𝜆

𝑤

∗

也就是说，

𝑤

∗

可以通过对

―

𝑤

𝑆

矩阵进行特征值分解获得，特殊的，在映射到 1 维

的情况下：

𝑤

∗

―

𝑤

(

𝑚

―

𝑚

)

。

ii.

1) 题干的损失矩阵可能是

𝜆

;

下载后可阅读完整内容，剩余7页未读，立即下载

彥爷

粉丝: 23
资源: 311

Fisher线性判别法与机器学习模型评估

PRML_2015-2016-郭立东1

PRML_2016-2017-郭立东1

PRML_2017-2018-郭立东1

PRML2018-2019个人回忆版.pdf

prml-slides-2ProbabilityDistributions.zip_Duda_prml_prml slides_

prml-slides-1Introduction.zip_matlab_slides_prml_prml slides pdf

matlab图像膨胀代码-PRML_matlab:PRML_matlab

matlab集成c代码-PRML_Exercise:PRML_锻炼

PRML-Slides-1

国科大模式识别与机器学习2018-2019回忆版

最新资源