以机器学习西瓜的好坏为例,写出朴素贝叶斯算法判断西瓜好坏的程序

时间: 2023-05-26 07:02:12 浏览: 64
假设用以下5个特征来描述西瓜: 1. 色泽:青绿(0)、乌黑(1)、浅白(2) 2. 根蒂:蜷缩(0)、稍蜷(1)、硬挺(2) 3. 敲声:清脆(0)、浊响(1)、沉闷(2) 4. 纹理:清晰(0)、稍糊(1)、模糊(2) 5. 脐部:凹陷(0)、稍凹(1)、平坦(2) 好瓜标记为1,坏瓜标记为0。 训练集如下: |编号 | 色泽 | 根蒂 | 敲声 | 纹理 | 脐部 | 好瓜 | |:-:|:-:|:-:|:-:|:-:|:-:|:-:| |1 | 2 | 2 | 0 | 2 | 0 | 0 | |2 | 2 | 2 | 0 | 2 | 0 | 0 | |3 | 1 | 2 | 0 | 2 | 0 | 1 | |4 | 0 | 2 | 0 | 2 | 0 | 1 | |5 | 0 | 1 | 0 | 2 | 0 | 1 | |6 | 0 | 0 | 0 | 1 | 0 | 0 | |7 | 1 | 0 | 0 | 1 | 0 | 1 | |8 | 2 | 1 | 1 | 1 | 1 | 1 | |9 | 0 | 0 | 1 | 1 | 1 | 1 | |10 | 1 | 1 | 0 | 0 | 2 | 1 | |11 | 0 | 1 | 1 | 0 | 2 | 1 | |12 | 1 | 1 | 0 | 1 | 2 | 1 | |13 | 1 | 2 | 2 | 2 | 1 | 0 | |14 | 2 | 1 | 1 | 0 | 2 | 1 | |15 | 0 | 1 | 1 | 2 | 1 | 0 | 代码实现如下: ``` # 好瓜的先验概率 p_good = 0.5 # 坏瓜的先验概率 p_bad = 0.5 # 色泽特征值与标记的映射关系 color_dict = {0: 'qing_lv', 1: 'wu_hei', 2: 'qian_bai'} # 根蒂特征值与标记的映射关系 root_dict = {0: 'quan_su', 1: 'shao_quan', 2: 'ying_ting'} # 敲声特征值与标记的映射关系 knock_dict = {0: 'qing_cui', 1: 'zhuo_xiang', 2: 'chen_men'} # 纹理特征值与标记的映射关系 texture_dict = {0: 'qing_xi', 1: 'shao_hu', 2: 'mo_hu'} # 脐部特征值与标记的映射关系 navel_dict = {0: 'ao_xian', 1: 'shao_ao', 2: 'ping_tan'} # 训练集 X_train = [[2, 2, 0, 2, 0], [2, 2, 0, 2, 0], [1, 2, 0, 2, 0], [0, 2, 0, 2, 0], [0, 1, 0, 2, 0], [0, 0, 0, 1, 0], [1, 0, 0, 1, 0], [2, 1, 1, 1, 1], [0, 0, 1, 1, 1], [1, 1, 0, 0, 2], [0, 1, 1, 0, 2], [1, 1, 0, 1, 2], [1, 2, 2, 2, 1], [2, 1, 1, 0, 2], [0, 1, 1, 2, 1]] # 训练集样本对应的标记 y_train = [0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0] # 待判断的西瓜 x_pred = [0, 2, 0, 2, 1] # 坏瓜的条件概率 p0 = 1 # 好瓜的条件概率 p1 = 1 # 计算坏瓜和好瓜的条件概率 for i in range(len(x_pred)): if i == 0: p0 *= X_train.count([x_pred[0], X_train[i][1], X_train[i][2], X_train[i][3], X_train[i][4]]) / y_train.count(0) p1 *= X_train.count([x_pred[0], X_train[i][1], X_train[i][2], X_train[i][3], X_train[i][4]]) / y_train.count(1) elif i == 1: p0 *= X_train.count([X_train[i][0], x_pred[1], X_train[i][2], X_train[i][3], X_train[i][4]]) / y_train.count(0) p1 *= X_train.count([X_train[i][0], x_pred[1], X_train[i][2], X_train[i][3], X_train[i][4]]) / y_train.count(1) elif i == 2: p0 *= X_train.count([X_train[i][0], X_train[i][1], x_pred[2], X_train[i][3], X_train[i][4]]) / y_train.count(0) p1 *= X_train.count([X_train[i][0], X_train[i][1], x_pred[2], X_train[i][3], X_train[i][4]]) / y_train.count(1) elif i == 3: p0 *= X_train.count([X_train[i][0], X_train[i][1], X_train[i][2], x_pred[3], X_train[i][4]]) / y_train.count(0) p1 *= X_train.count([X_train[i][0], X_train[i][1], X_train[i][2], x_pred[3], X_train[i][4]]) / y_train.count(1) else: p0 *= X_train.count([X_train[i][0], X_train[i][1], X_train[i][2], X_train[i][3], x_pred[4]]) / y_train.count(0) p1 *= X_train.count([X_train[i][0], X_train[i][1], X_train[i][2], X_train[i][3], x_pred[4]]) / y_train.count(1) # 计算后验概率 posterior_bad = p0 * p_bad posterior_good = p1 * p_good # 判断西瓜好坏 if posterior_bad > posterior_good: print('坏瓜') else: print('好瓜') ```

相关推荐

最新推荐

recommend-type

机器学习实战 - KNN(K近邻)算法PDF知识点详解 + 代码实现

KNN(K- Nearest Neighbor)法即K最邻近法,最初由 Cover和Hart于1968年提出,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路非常简单直观:如果一个样本在特征空间中的K个最相似(即特征...
recommend-type

Python机器学习之决策树算法实例详解

主要介绍了Python机器学习之决策树算法,较为详细的分析了实例详解机器学习中决策树算法的概念、原理及相关Python实现技巧,需要的朋友可以参考下
recommend-type

机器学习之KNN算法原理及Python实现方法详解

主要介绍了机器学习之KNN算法原理及Python实现方法,结合实例形式详细分析了机器学习KNN算法原理以及Python相关实现步骤、操作技巧与注意事项,需要的朋友可以参考下
recommend-type

机器学习分类算法实验报告.docx

对于KNN,SVM,adaboost以及决策树等分类算法对数据集运行结果进行总结,代码点我博文
recommend-type

机器学习算法岗面试知识.pdf

作者于2018年夏秋开始备战机器学习算法岗,总结汇总了如此的面试和笔试经验,希望能够对众多童鞋有用。
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

spring添加xml配置文件

1. 创建一个新的Spring配置文件,例如"applicationContext.xml"。 2. 在文件头部添加XML命名空间和schema定义,如下所示: ``` <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.springframework.org/schema/beans
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。