高斯分布参数极大似然估计与EM算法详解

需积分: 50 134 浏览量更新于2024-09-10 4 收藏 209KB PDF 举报

在本篇讲义中，主要讨论的是在哈工大研究生课程中关于高斯分布参数的极大似然估计和EM算法的应用。高斯分布是一种常见的连续概率分布，在许多领域如信号处理、机器学习和统计分析中都有广泛应用，其参数包括均值μ和协方差矩阵Σ。首先，我们假设有一组独立的样本集D，每个样本x_i都从均值为μ、协方差矩阵为Σ的高斯分布中抽取。为了估计这些参数，我们利用极大似然原理，即找到使得样本数据出现的概率最大的参数值。对数似然函数定义为所有样本点在给定参数下的联合概率，通过对其进行求导并设置为零，可以得到参数的极大似然估计。对于均值向量μ的极大似然估计，我们对对数似然函数关于μ的偏导数求导，利用协方差矩阵是对称矩阵的特性，最终得到μ的极大似然估计为样本均值，即μ = (1/n) * Σ xi。这个结果表明，均值的估计是所有样本点的算术平均。协方差矩阵Σ的极大似然估计则更为复杂。在推导过程中，涉及到矩阵的逆、行列式和导数性质。具体来说，通过对对数似然函数进行变换，我们可以利用矩阵的导数性质，如矩阵的逆与导数的关系，以及矩阵乘积的导数规则，来计算Σ的估计。然而，由于公式较长且涉及矩阵运算，这里并未给出完整的推导步骤，但通常会使用迭代方法，比如著名的Expectation-Maximization (EM)算法，来优化矩阵Σ的估计。 EM算法是一种用于隐含变量模型参数估计的迭代方法，它将问题分解为两个步骤：期望（E）步和最大化（M）步。在估计协方差矩阵时，EM算法通过先对观察到的数据求期望，然后基于这个期望值更新参数，重复这两个步骤直到收敛。这种方法在处理高斯混合模型等复杂情况下尤其有效。本讲义中的内容着重于高斯分布参数的极大似然估计，尤其是协方差矩阵的估计，以及如何通过EM算法进行迭代求解。理解这些概念和技术对于处理实际的统计建模和机器学习问题至关重要。在实际应用中，熟练掌握这些方法能帮助我们更准确地估计模型参数，从而提升数据分析和模型预测的准确性。

 高斯混合模型 EM 算法的迭代公式推导

我们首先来推导一般混合密度模型参数估计的 EM 算法迭代公式，然后再将一般的混合

密度模型具体化为高斯混合模型。

I. 混合密度模型

假设样本集





X  xx

中的样本相互独立，并且按照如下的过程产生：

1. 样本是依据概率由 K 个分布中的一个产生的，分布的概率密度函数为





p xθ

，

1, ,kK 

，

为分布的参数；

2. 由第

个分布产生样本的先验概率为



；

3. 先验概率





α  ，以及分布的参数

θθ

均未知。

我们称样本集 X 来自于一个“混合密度模型”，混合密度模型的概率密度函数为：

 







xΘ xθ （1）

其中



,,,

Θαθ θ

为模型的参数，每个





p xθ

称为一个分量密度。

II. 混合密度模型参数估计的 EM 迭代公式

混合密度模型的参数估计中，由于样本是由哪个分量密度所产生的信息





Yy y 

是未知的，因此需要将其视作“丢失”信息，使用 EM 算法进行估计。EM 算法中 E 步和 M 步

的迭代公式：

E步：







;ln,,

QEpXYX











ΘΘ Θ Θ

（2）

M步：





arg max ;

Q

ΘΘΘ

（3）

其中

是对参数

的一个猜测值。E 步计算的是在已知样本集 X 和参数猜测值

的

条件下期望对数似然函数；而 M步则是对





;

Q ΘΘ

的优化。更新参数的猜测值设置：

ΘΘ

，

进入下一轮迭代。

E 步期望对数似然函数





;

Q ΘΘ

的推导：

训练样本

是由第

个分量密度函数产生的，

1, ,





，这两个随机事件的联合概

率密度：









ii y iy

py p



xΘ xθ

因此，关于完整数据集





XY

的对数似然函数为：



ln , ln

yiy

lpXY p

















ΘΘ xθ （4）

另外根据贝叶斯公式，在已知参数的一个猜测值





,, , ,,

gggg



Θθθ

和样本

的

条件下，

由第

个分量产生的概率为：

剩余11页未读，继续阅读

chaihahaha

粉丝: 0

高斯分布参数极大似然估计与EM算法详解

二维混合高斯分布的EM算法（matlab）

gaussian_mixture_mo​del.m:使用 EM 算法估计一维高斯混合模型的参数。-matlab开发

《概率论与数理统计》讲义笔记

FitFunc.zip_EM似然估计_似然函数_分布估计算法_最大似然_混合高斯分布

EM算法 极大似然估计的文章

EM算法解析：从极大似然估计到混合高斯模型

EM算法详解：身高分布估计中的极大似然估计策略

EM算法详解：极大似然估计与其在高斯混合模型中的应用

机器学习入门：极大似然估计与算法解析

EM算法拟合高斯混合模型并绘制最大似然估计图

最新资源

gaussian_mixture_model.m:使用 EM 算法估计一维高斯混合模型的参数。-matlab开发

EM算法极大似然估计的文章