理解朴素贝叶斯分类：原理、应用与优化

需积分: 16 163 浏览量更新于2024-07-15 1 收藏 3.08MB PPTX 举报

"该资源是关于朴素贝叶斯分类的PPT教程，涵盖了朴素贝叶斯分类的理论基础和实际应用。通过一个概率问题的小故事引入，解释了朴素贝叶斯分类的工作原理，并展示了如何使用代码实现分类。此外，还讨论了如何处理连续值特征以及半朴素贝叶斯分类器的概念，强调了朴素贝叶斯分类器在现实问题中的有效性，即使其假设在实际中可能不完全成立。" 朴素贝叶斯分类是一种基于贝叶斯定理的统计分类技术，其核心理念是假设各个特征之间相互独立。这种假设使得模型能够通过计算每个特征出现的概率来进行预测，简化了计算过程。在机器学习领域，朴素贝叶斯分类常用于文本分类、垃圾邮件过滤等任务，因其高效、易于理解和实现而受到青睐。在讲解中，提到了一个A市外星人检测的例子，用以直观地阐述贝叶斯定理的应用。问题的关键在于计算在已知检测仪误判率的情况下，被检测为外星人的个体实际上是外星人的概率。这涉及到后验概率的计算，即利用贝叶斯公式： P(A|B) = P(B|A) * P(A) / P(B) 在这个例子中，A表示“是外星人”，B表示“检测结果为外星人”。通过计算后验概率，可以得出真实情况。在实际编程实现中，由于小数值的乘法可能导致下溢问题，因此通常使用对数来优化计算，避免了这个问题。例如，将乘法转换为加法： ln(f(x)) = ln(a) + ln(b) 在PPT的代码示例中，`classifyNB`函数用于分类，它接收待分类样本的特征向量、两个类别的先验概率向量（p0Vec和p1Vec）以及类别的先验概率（pClass1），通过计算每个类别的后验概率来进行预测。对于连续值特征，朴素贝叶斯分类通常要求特征离散化，但半朴素贝叶斯分类器则允许一定程度的特征依赖，它试图在保持计算效率的同时考虑部分属性之间的关联性。这样可以在不完全违反朴素假设的情况下提高分类效果。总结来说，朴素贝叶斯分类虽然基于简化的独立假设，但在很多情况下仍表现出良好的分类性能。这是因为即使特征之间存在某种程度的相关性，只要这种依赖对所有类别的影响相对一致，或者可以相互抵消，分类结果仍然准确。因此，尽管朴素，朴素贝叶斯分类器在实践中仍然是一个强大且实用的工具。

开篇小故事：

A 市有 10 万人，其中一个是外星人。我们现有一台能够检测外星人的检测仪，不过它有 1% 的概率

判断错误（根据以往的经验）。也就是说有 1% 的可能性把外星人判断为人类。也有 1% 的可能性把人类

判断为外星人。

问：从 10 万人中随机抽取一人后，检测仪将他判断为外星人，求这个人的确是外星人的概率？

X ：接受检测的人的实际身份

Y ：检测仪结果

计算：

P(Y= 外星人 ) = P(X= 正常人， Y= 外星人 )+P(X= 外星人， Y= 外星人 )

= P(Y= 正常人 | X= 外星人 ) P(X= 外星人 ) +P(Y= 外星人 | X= 外星人 )

= 99/100 * 1/10 万 + 1/100 * 99999/10 万 = 0.0100098 （约 1% ）

P(X= 外星人 |Y= 外星人 ) = 0.000989 （约 0.1% ）

后验概率只有 0.1% ！！！

剩余16页未读，继续阅读

从善若水

粉丝: 4w+
资源: 51

理解朴素贝叶斯分类：原理、应用与优化

理解贝叶斯分类：从朴素贝叶斯到贝叶斯网络

毕业设计项目：京东商品评论朴素贝叶斯二分类

基于朴素贝叶斯的京东评论分类项目资源包

朴素贝叶斯实战.pptx贝叶斯分类器ppt代码全

贝叶斯网络与朴素贝叶斯方法.pptx

3.贝叶斯分类器--贝叶斯网络与朴素贝叶斯分类器.pptx

机器学习__朴素贝叶斯分类器.pptx

机器学习__贝叶斯定理.pptx

朴素贝叶斯分类PPT学习教案.pptx

朴素贝叶斯分类器PPT学习教案.pptx

最新资源