EM算法详解：从极大似然估计到隐变量优化

需积分: 0 170 浏览量更新于2024-08-05 收藏 1004KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"这篇内容主要介绍了EM算法，全称Expectation Maximization Algorithm，它是一种用于处理含有隐含变量的不完全数据集的极大似然估计方法。EM算法通过迭代过程来寻找模型参数的最佳估计，每次迭代包括E步（期望）和M步（最大化）。" 在EM算法中，我们首先从极大似然估计的角度出发。极大似然估计是统计学中常用的一种参数估计方法，它的基本思想是找到一组参数，使得给定观测数据出现的概率最大。对于已知分布但未知参数的情况，我们可以通过计算似然函数，并对似然函数取对数来简化求解过程。这通常涉及到写出似然函数𝐿(𝜃)，取对数得到 Hv(𝜃) = log𝐿(𝜃)，然后求导并令其等于0，从而得到似然方程，最后解这个方程得到参数的极大似然估计。然而，在存在隐含变量的情况下，直接应用极大似然估计变得复杂。EM算法在这种情况下发挥作用。EM算法的每个迭代由两部分组成： 1. E步（期望）：在当前参数估计值下，计算隐变量的期望值，即条件概率𝑃(𝑍|𝑋,𝜃)。这一步骤提供了关于隐变量状态的信息，即使我们无法直接观测到它们。 2. M步（最大化）：利用E步得到的期望值，更新模型参数，最大化在期望值下的似然函数。这一步通常涉及到对似然函数的对数形式取期望，以简化优化问题。在形式化描述中，EM算法试图最大化观测数据𝑋的条件对数似然函数𝐻(𝜃) = ln𝑃(𝑋|𝜃)。由于隐变量𝑍的存在，我们不能直接处理这个函数，而是通过联合分布𝑃(𝑋,𝑍|𝜃)和条件分布𝑃(𝑍|𝑋,𝜃)来间接操作。利用Jensen不等式，可以将对数似然函数转化为更便于处理的形式，这通常涉及到引入一个关于隐变量Z的分布𝑞(𝑧)。 Jensen不等式在数学优化中是一个非常重要的工具，它指出对于一个凸函数𝑓(𝑥)，有fq(𝑥) ≥ f(E[𝑥|q])，其中E[𝑥|q]是随机变量𝑥在概率分布𝑞下的期望值。这个不等式在EM算法中用于从条件分布的期望角度重新表达对数似然函数，使得在M步中可以更方便地进行参数优化。 EM算法的优势在于它能处理含有隐含变量的复杂模型，并且通过迭代不断逼近最优解。尽管在每一步迭代中可能无法直接求得全局最优解，但通常可以确保参数估计的质量逐渐提高，直至达到局部最优解。这种方法在机器学习、模式识别、生物信息学等领域有广泛应用，如混合高斯模型的参数估计和隐马尔科夫模型的学习等。

资源详情

资源推荐

Expectation Maximization Algorithm

EM 算法是一种从不完全数据或者含有隐含变量（hidden variable）的数据集中求

解概率模型参数的极大似然估计方法，采用迭代的方式，每次迭代分为两步：E 步：

求期望（expectation）；M 步：求极大似然（maximization）。

1.从极大似然估计到 EM 算法

1.1 引出

在之前的学习过程中，我们知道在已知数据的分布而不知具体分布参数的时候，我

们会使用极大似然估计来估计出该分布的参数  ，具体过程为：

1 写出似然函数 󰇛󰇜  󰇛󰇜  

2.对似然函数取对数，得到 log 形式󰇛󰇜  󰇛󰇜  󰇛󰇛󰇜󰇜  

3.对对数似然函数求导，令其为 0，得到似然方程

4.求解似然方程，得到所求参数

极大似然估计，只是一种概率论在统计学的应用，它是参数估计的方法之一。假设

已知某个随机样本满足某种概率分布，但其中具体参数不清楚，参数估计就是通过

若干次试验，观察其结果，利用结果推出参数的估计值。最大似然估计是建立在这

样的思想上：已知某个参数能使这个样本出现的概率最大，我们当然不会再去选择

其他小概率的样本，所以干脆就把这个参数作为估计的真实值。

与最大似然估计不同的是，EM 所处理的是不完备的数据，其中含有隐含变量，也

就是说很难直接写出似然函数，我们需要通过隐含变量的介入，得到隐变量条件下

的似然函数，再进一步进行求解。

形式化描述：假设我们有一个观测样本集 

（

















）

，这些样本属于

不同的类别  󰇛











󰇜，即模型中的隐变量数据，联合分布󰇛󰇜,条件

分布󰇛󰇜但任务是求模型󰇛󰇜的参数 ，此时因为隐变量的存在，使得观

测样本不是完全数据，最大似然很难直接用于求解，自然地想法是如果我们知道隐

变量，那么问题便会变得简单。此时问题变成

󰇛󰇜  󰇛󰇜

󰇛󰇜  



󰇛󰇜

对于（1）式，即为似然函数,我们的目标是去最大化（1）式，所以我们根据联合

概率密度下求边缘概率密度的公式，于是我们得到了（2）式，显然去对一个和的

log 函数求导并不是一件容易的事情，于是我们引入隐含变量 Z 的分布󰇛󰇜，下面

我们会对其进行具体的分析和推导.

下载后可阅读完整内容，剩余9页未读，立即下载

宝贝的麻麻

粉丝: 39
资源: 294

EM算法详解：从极大似然估计到隐变量优化

13.EM算法1

21. EM算法1

理解EM算法在MATLAB中的应用

EM算法收敛性分析与收敛速度优化

揭开EM算法的神秘面纱：GMM中的期望最大化算法详解

EM算法解密符号替代密码

EM算法在高斯混合模型中的应用演示

MATLAB中的EM算法在线性回归中的应用

K均值聚类算法与EM算法的对比与应用场景

模式识别与聚类分析：EM算法原理与实践

ParClick：基于EM的点击模型的可扩展并行算法的研究

"CryoDRGN2：从冷冻EM图像重建真实蛋白质结构的新算法

基于粒子滤波和EM算法的PX氧化副反应尾气COx含量软测量的研究

"基于粒子滤波和EM算法的软测量方法在未来软件与多媒体工程应用中的有效性

基于Wi-Fi的室内定位系统中的删失和丢弃数据下GMM参数估计的EM算法及应用

"Bilal模型：0情况下的EM算法估计的风险及存在唯一性定理

weixin007医院管理系统+Springboot.rar

5G网络优化：片区满意度交流材料.pptx

操作系统内可以一键关闭WD

weixin086基于微信小程序的影院选座系统+ssm.rar

最新资源