逻辑回归到最大熵模型：深度理解与拓展

版权申诉

117 浏览量更新于2024-08-04 收藏 645KB PDF 举报

本文档深入探讨了从逻辑回归到最大熵模型的转变过程，它是机器学习领域中的一个重要桥梁。逻辑回归最初被介绍作为一种二分类模型，其核心是通过线性组合和sigmoid函数估计输入特征与类别之间的关系。然而，通过扩展sigmoid函数到softmax，逻辑回归得以扩展到多类分类问题。在理解了sigmoid函数如何作为概率估计的基础后，文章指出逻辑回归的假设函数中的大分母实际上是一个配分函数Z，它负责将未归一化的输出转换为概率分布。当我们关注分母（即配分函数）的作用后，可以忽略它，将焦点集中在分子上，即特征向量和权重的乘积，这与神经网络中的权重加权求和类似。接下来，文档引入了一种新的视角，即每个特征维度可以有两个取值（比如0和1），这样每个特征值与类别之间可以用一个参数来衡量关联性。这种方法相比于原始的三个权重参数，提供了更大的灵活性，能够处理更多种类的信息。例如，在性别预测任务中，身高特征可能是一个强特征，不同高度区间对应的参数权重能更精确地反映分类决策。这种将逻辑回归转换为更细致的表示形式，实际上是最大熵模型（Maximum Entropy Model, MaxEnt）的雏形。最大熵模型是一种统计学习方法，它的目标是找到最不确定的模型，同时满足给定的约束条件，如先验知识或观测数据的统计特性。通过这种方式，模型能够更有效地捕捉特征之间的复杂依赖关系，而不仅仅是线性的组合。此外，最大熵模型还能进一步发展为条件随机场（Conditional Random Fields, CRF），这是一种常用于序列标注任务的模型，它考虑了相邻标签之间的相互依赖。无向图模型则更为一般化，适用于描述更复杂的数据结构。从逻辑回归到最大熵模型的演变，展示了机器学习模型由简单到复杂的深化过程，特别是如何通过增加灵活性和处理更多元的信息来提高模型的表达能力。理解和掌握这一过程对于深入理解机器学习算法及其在实际问题中的应用至关重要。

从逻辑回归到最⼤熵模型

原创

⼣⼩瑶

2017-07-12⼣⼩瑶的卖萌屋

在《逻辑回归》与《sigmoid与softmax》中，⼩⼣讲解了逻辑回归背后藏着的东西，这些东西虽然并不是⼯程中实

际看起来的样⼦，但是却可以帮助我们很透彻的理解其他更复杂的模型，以免各个模型⽀离破碎。

本⽂中，⼩⼣将带领⼤家从另外⼀个⻆度看待逻辑回归，从这个⻆度出发，⼜可以轻易的衍⽣出⼀系列如最⼤熵模

型、条件随机场，甚⾄⼀般化的⽆向图模型。

还是回到逻辑回归这个熟悉的假设函数上来：

根据《sigmoid到softmax》，我们很容易通过将sigmoid推⼴到softmax来将逻辑回归也推⼴到多类分类器（此时叫

softmax分类器）。这时的假设函数：

⾄此，有疑问的同学乖乖的回去看《sigmoid与softmax》哦~

⽽根据《逻辑回归到受限玻尔兹曼机》中的做法，上⾯假设函数中的⼤分⺟就可以表⽰成⼀个配分函数Z，其作⽤就

可以看作是⽤来归⼀化的（通俗的讲就是将不限制范围的“亲密度”值转化为限制在0-1之间的值，即概率）。

好啦~重点开始了。既然假设函数h算的就是当前样本属于某个类别的概率，既然Z就是⽤来将输出值转换为概率值

的，那么我们就不管Z了，反正信息量就聚焦在分⼦上。⽽当前样本是⽤特征向量表⽰的，所以将分⼦画出来后其实

看起来跟神经⽹络差不多：

下载后可阅读完整内容，剩余5页未读，立即下载

普通网友

粉丝: 1279

逻辑回归到最大熵模型：深度理解与拓展

最大熵模型.pdf

论文研究-基于最大熵原理的多失效模式下煤巷锚杆支护结构体系可靠度模型.pdf

李航《统计学习方法》笔记 --从原理到实现：基于R.pdf

逻辑回归与最大熵模型

有监督学习模型都有哪些

maxent最大熵模型

如何在MATLAB中实现最大熵模型，并应用于分类任务？请结合实例详细说明。

用iris数据模拟最大熵模型

最大熵马尔科夫模型与隐马尔可夫模型和最大熵模型之间的关系

最大熵模型python代码

最新资源