— —算 法 杂 货 铺 分 类 算 法 之 朴 素 贝 叶 斯 分 类 (Naive
Bayesian classication)
2010-09-17 13:09 by T2 噬菌体, 51228 阅读, 37 评论, 收藏, 编辑
0、写在前面的话
我个人一直很喜欢算法一类的东西,在我看来算法是人类智慧的精华,其
中蕴含着无与伦比的美感。而每次将学过的算法应用到实际中,并解决了实际
问题后,那种快感更是我在其它地方体会不到的。
一直想写关于算法的博文,也曾写过零散的两篇,但也许是相比于工程性
文章来说太小众,并没有引起大家的兴趣。最近面临毕业找工作,为了能给自
己增加筹码, 决定再次复习算法方面的知识,我决定趁这个机会,写一系列关
于算法的文章。这样做,主要是为了加强自己复习的效果,我想,如果能将复
习的东西用自己的理解 写成文章,势必比单纯的读书做题掌握的更牢固,也更
能触发自己的思考。如果能有感兴趣的朋友从中有所收获,那自然更好。
这个系列我将其命名为“算法杂货铺”,其原因就是这些文章一大特征就是
“杂”,我不会专门讨论堆栈、链表、二叉树、查找、排序等任何一本数据结构
教科书都 会讲的基础内容,我会从一个“专题”出发,如概率算法、分类算法、
NP 问题、遗传算法等,然后做一个引申,可能会涉及到算法与数据结构、离散
数学、概率 论、统计学、运筹学、数据挖掘、形式语言与自动机等诸多方面,
因此其内容结构就像一个杂货铺。当然,我会竭尽所能,尽量使内容“杂而不
乱”。
1.1、摘要
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故
统称为贝叶斯分类。本文作为分类算法的第一篇,将首先介绍分类问题,对分
类问题进行一 个正式的定义。然后,介绍贝叶斯分类算法的基础——贝叶斯定
理。最后,通过实例讨论贝叶斯分类中最简单的一种:朴素贝叶斯分类。
1.2、分类问题综述
对于分类问题,其实谁都不会陌生,说我们每个人每天都在执行分类操作
一点都不夸张,只是我们没有意识到罢了。例如,当你看到一个陌生人,你的
脑子下意识判 断 TA 是男是女;你可能经常会走在路上对身旁的朋友说“这个人
一看就很有钱、那边有个非主流”之类的话,其实这就是一种分类操作。
评论0