机器学习基础：概率论与信息论入门

需积分: 10 21 浏览量更新于2024-07-18 收藏 1.47MB PDF 举报

《文本上的算法》是一本深入浅出的IT教程，旨在帮助读者理解机器学习的基础和关键算法。作者路彦雄分享了他的个人学习笔记和理解，将理论与实践相结合，以帮助读者更好地掌握概率论和信息论这两个核心领域的知识。在理论篇中，作者强调了理解机器学习的前提，即对概率和信息论有扎实基础的重要性。 1.1 概率论：概率论是衡量随机事件发生可能性的数学工具，日常生活中的许多不确定性都可以用概率来量化。例如，天气预报的降雨概率，或者掷骰子时各面朝上的概率。大数定律指出，随着试验次数增加，小概率事件出现的频率会趋近于其理论概率，这是理解和预测随机现象的重要依据。 1.2 信息论：信息论是研究信息传输和处理效率的学科，它涉及到熵、信息量和编码理论等概念。对于机器学习，信息熵是用来衡量信息的不确定性，而香农熵则用于数据压缩和编码设计，对模型的选择和性能评估至关重要。第二章中，作者探讨了最优化问题，包括最大似然估计和最大后验估计，这两种方法在参数估计和模型选择中被广泛应用。梯度下降法则是求解优化问题的一种常用算法，通过迭代调整参数来最小化损失函数，是许多机器学习算法的核心。 3.1 机器学习：简要介绍了什么是机器学习，它是一种让计算机通过数据自我学习和改进的技术，而不是明确编程执行特定任务。常见的算法如逻辑回归、最大熵模型（条件随机场）和主题模型（TopicModel）展示了机器学习如何处理分类、预测和模式发现。深度学习作为机器学习的一个分支，3.5章节深入讲解了多层神经网络的工作原理，以及它在图像识别、自然语言处理等领域中的突破性应用。最后，作者还提到了其他一些基础模型，如kNN（k近邻）、k-means（聚类）、决策树和SVM（支持向量机），这些算法在实际问题中各有其应用场景。应用篇将聚焦于自然语言处理（NLP）领域，探讨搜索引擎的工作原理，索引的构建和背后的理论基础，这些都离不开概率论和信息论的支持。通过实际案例和通俗易懂的语言，帮助读者将理论知识与实际应用相结合。《文本上的算法》提供了一个全面且易于理解的机器学习入门指南，无论你是初学者还是经验丰富的专业人士，都能从中获益匪浅。作者鼓励读者在阅读过程中积极思考，结合多种资源进行深入学习，以提高对复杂算法的理解和掌握。

是求条件概率p(A|S)达到最大值的那个分词结果，这个概率不好求出，

这时贝叶斯法则就用上派场了，根据贝叶斯公式改写为:

󰇛

A|S

󰇜

󰇛

S|A

󰇜

p(A)

p(S)

显然， p(S)是一个常数，那么公式相当于改写成：

󰇛

A|S

󰇜

 p

󰇛

S|A

󰇜

p(A)

其中， p

󰇛

S|A

󰇜

表示(A)这种分词生成句子S的可能性；p

󰇛

󰇜

表示(A)

这种分词本身的可能性。

下面的事情就很简单了，对于每种分词计算一下p

󰇛

S|A

󰇜

p(A)这个

值，然后取最大的，得到的就是最靠谱的分词结果。比如“学历史知

识”（用S表示）可以分为如下两种（当然，实际情况就不止两种情况

了）：“学历\史\知识”（用A表示，A

=学历，A

=史，A

=知识）和

“学/历史/知识”（用B表示，B

=学，B

=历史，B

=知识），那么我

们分别计算一下p

󰇛

S|A

󰇜

p(A)和p

󰇛

S|B

󰇜

p(B)，哪个大，说明哪个就是好的

分词结果。

但是p

󰇛

S|A

, A

, A

󰇜

p(A

, A

, A

)这个公式并不是很好计算，

󰇛

S|A

, A

, A

󰇜

可以认为就是 1，因为由A

, A

, A

必然能生成S,那么

剩下就是如何计算p(A

, A

, A

)？

在数学中，要想简化数学模型，那就是假设。我们假设句子中一

个词的出现概率只依赖于它前面的那个词（当然可以依赖于它前面的m

个词），这样，根据全概率公式：

󰇛

, A

, A

󰇜

P(A

)P(A

| A

, A

) P(A

| A

, A

, , A

k1

)

就可以改写为：

剩余57页未读，继续阅读

fanslin

粉丝: 1
资源: 8

机器学习基础：概率论与信息论入门

文本上的算法.pdf

文本上的算法_NLP_路彦雄

文本上的算法_第二版

LD文本比较算法.zip_LD算法_differ33w_文本比较_文本比较算法

文本查重算法

正向最大匹配分词算法及KNN文本分类算法python实现_knn中文文本分类算法python,文本自动分词1.给定一个分词词典;2.实现正向最大匹配算法对文本进

java文本搜索算法

文本聚类算法TextColuster

易语言文本相似度算法

文本分类算法LDA

最新资源