没有合适的资源?快使用搜索试试~ 我知道了~
首页朴素贝叶斯算法分析天气的好坏
朴素贝叶斯算法分析天气的好坏
需积分: 50 3.4k 浏览量
更新于2023-05-22
评论 7
收藏 426KB DOCX 举报
大作业的任务是用朴素贝叶斯算法分析天气的和环境的好坏决定是否出门打网球。首先构建训练集;再实现分类算法,通过分类算法对训练数据集的各个特征属性分析,计算出各个特征属性的概率及每个特征属性划分对每个类别的条件概率估计;然后输入测试数据,由算法给出分类结果,结果为“Yes”或“No”。
资源详情
资源评论
资源推荐

一、题目:朴素贝叶斯分类
二、引言
大作业的任务是用朴素贝叶斯算法分析天气的和环境的好坏决定是否出门
打网球。首先构建训练集;再实现分类算法,通过分类算法对训练数据集的各
个特征属性分析,计算出各个特征属性的概率及每个特征属性划分对每个类别
的条件概率估计;然后输入测试数据,由算法给出分类结果,结果为“ Yes”或
“No”。
三、算法介绍
1. 朴素贝叶斯分类的原理
朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为
这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待
分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此
待分类项属于哪个类别。通俗来说,就好比这么个道理,你在街上看到一个黑
人,我问你你猜这哥们哪里来的,你十有八九猜非洲。为什么呢?因为黑人中
非洲人的比率最高,当然人家也可能是美洲人或亚洲人,但在没有其它可用信
息下,我们会选择条件概率最大的类别,这就是朴素贝叶斯的思想基础。
朴素贝叶斯分类的正式定义如下:
1、设 为一个待分类项,而每个 a 为 x 的一个特征属性。
2、有类别集合 。
3、计算 。
4、如果 ,则 。
计算第 3 步中的各个条件概率:
1、找到一个已知分类的待分类项集合,这个集合叫做训练样本集。
2 、 统 计 得 到 在 各 类 别 下 各 个 特 征 属 性 的 条 件 概 率 估 计 。 即

3、如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推导:
因为分母对于所有类别为常数,因为我们只要将分子最大化皆可。又因为各特
征属性是条件独立的,所以有:
2. 根据上述分析,朴素贝叶斯分类的流程可以由下图表示(暂时不考虑验
证):
可以看到,整个朴素贝叶斯分类分为三个阶段:
1) 第一阶段——准备工作阶段。这个阶段的任务是为朴素贝叶斯分类做必
要的准备,主要工作是根据具体情况确定特征属性,并对每个特征属性
进行适当划分,然后由人工对一部分待分类项进行分类,形成训练样本
集合。这一阶段的输入是所有待分类数据,输出是特征属性和训练样本 。
这一阶段是整个朴素贝叶斯分类中唯一需要人工完成的阶段,其质量对
整个过程将有重要影响,分类器的质量很大程度上由特征属性、特征属
性划分及训练样本质量决定。

2) ——第二阶段 分类器训练阶段。这个阶段的任务就是生成分类器,主要
工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每
个类别的条件概率估计,并将结果记录。其输入是特征属性和训练样本 ,
输出是分类器。这一阶段是机械性阶段,根据前面讨论的公式可以由程
序自动计算完成。
3) ——第三阶段 应用阶段。这个阶段的任务是使用分类器对待分类项进行
分类,其输入是分类器和待分类项,输出是待分类项与类别的映射关系。
这一阶段也是机械性阶段,由程序完成。
四、数据描述
训练数据集:由人工手动创建,输入到计算机程序的 txt 文件中。
!"#
$"%
&"%
'%
(#
)%
*"#
#
#
!"#
其中 Weather(天气)、Temperature(温度)、Humidity(湿度)、Wind
(风力)是四个特征属性,PlayTennis(打网球)是分类属性。
五、实践过程
1. 算法实现
代码展示:
剩余11页未读,继续阅读


















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0