EM算法详解：三硬币模型实战与隐变量处理

需积分: 0 4 浏览量更新于2024-08-05 收藏 1.09MB PDF 举报

EM算法是一种在数据中存在隐变量时，通过迭代优化来估计参数的统计学方法，尤其适用于最大似然估计中的复杂问题。以三硬币模型为例，它描绘了两个硬币A和B，每次实验随机选择一枚硬币进行10次投掷，但观察结果中隐藏了选择硬币的信息。在完全数据情况下，我们能明确知道每轮投掷的是哪枚硬币，使用极大似然估计直接求解参数相对简单。然而，当这些选择信息成为隐变量时，即我们面对的是不完全数据，传统的极大似然估计就变得棘手。 EM算法的核心思想是分为两个步骤：E-Step和M-Step。在E-Step（期望步）中，基于当前的参数估计，我们计算出隐变量（例如每轮选择硬币的概率）的最佳概率分布。这一步相当于对观察数据进行条件概率的估计，尽管我们无法知道具体的选择，但可以通过观测数据来推测。接着在M-Step（最大化步）中，我们不再关注单个隐变量的具体取值，而是考虑所有可能的情况，计算出观测结果对每个可能的隐变量状态下的概率期望。这个期望就是观测数据与隐变量概率分布结合后的数学期望，用于更新模型参数。这是一个迭代过程，新参数估计出来后，再次进行E-Step和M-Step，直至算法收敛，达到最优参数估计。在数学推导过程中，通常会假设每个样本服从某种分布，并通过边缘概率分布的公式来简化问题。直接最大化似然函数（如二项分布的形式）由于涉及多个隐变量的联合分布，变得复杂。EM算法通过分解这个难题，逐步逼近全局最优解，展现了其在处理此类问题上的强大之处。吴恩达在CS229课程中详细介绍了EM算法的原理、推导以及其实用性，特别是如何将这个理论应用于实际问题，如估计硬币A和B的正面朝上概率，即使在数据不完整的情况下也能找到有效解决方案。EM算法的精髓在于通过不断迭代，期望（E-Step）与最大化（M-Step）相结合，最终达到参数估计的全局最优。

EM算法原理解析

【参考资料】

吴恩达 CS229课程资料

What is the expectation maximization algorithm?



1. EM算法引入

EM算法，是在数据分布中存在隐变量（latent variable）的情况下，对参数进行极大似然估计的方法。有隐变量的似

然函数的形式一般是和的对数，在应用传统极大似然法时，对这个函数求导是非常麻烦的，EM算法的引入巧妙地解

决了这个问题。

引入EM算法时最常用的例子就是三硬币模型，这里给出这个例子的变体版本，来说明EM算法和极大似然估计的区

别。

现在有两枚硬币A和B，我们进行如下实验：在每轮中，随机选取一枚硬币，投掷十次，记录下正面和反面朝上的情

况，一共进行五轮实验，即共投掷50次。现在我们的任务是估计硬币A和B正面朝上的概率

，

。在已知每轮选择

的是哪枚硬币的前提下，参数估计非常简单，直接应用极大似然估计法，可以得到

如下图所示：

但如果我们不知道每轮投掷的是哪枚硬币，情况就比较麻烦了，在利用式（1.1）和（1.2）计算时，我们无法知道分

母的确切大小，我们知道的只有分子。这时候，每轮投掷的具体是哪枚硬币，对于我们来说，就是一个隐变量。我们

称这种情况下观测到的硬币朝向是不完全数据。要解决这类问题，就需要EM算法的帮助。

下载后可阅读完整内容，剩余5页未读，立即下载

老光私享

粉丝: 880

EM算法详解：三硬币模型实战与隐变量处理

EM算法原理与EM聚类应用实例解析

EM算法原理与三枚硬币问题解析

EM算法原理及应用详解

EM 算法原理及其应用 EM 算法原理及其应用

EM算法原理及实现EM算法原理及实现

EM算法原理详解及其应用

EM算法的原理例子

EM算法分析

weka 中em算法详细解析

EM算法原理与实现：MATLAB源码详细解析

最新资源