朴素贝叶斯的python代码实例

下面是一个朴素贝叶斯的Python代码实例，代码中包含了对样本数据的处理、训练和预测等步骤： ```python # -*- coding: utf-8 -*- from numpy import * # 过滤网站的恶意留言 def loadDataSet(): postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'], ['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'], ['stop', 'posting', 'stupid', 'worthless', 'garbage'], ['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'], ['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']] classVec = [0,1,0,1,,1] # 1代表侮辱性文字，0代表正常言论 return postingList,classVec # 创建词汇表 def createVocabList(dataSet): vocabSet = set([]) # 创建一个空的不重复列表 for document in dataSet: vocabSet = vocabSet | set(document) # 取并集 return list(vocabSet) # 将文本转换为词向量 def setOfWords2Vec(vocabList, inputSet): returnVec = [0]*len(vocabList) # 创建一个其中所含元素都为0的向量 for word in inputSet: if word in vocabList: returnVec[vocabList.index(word)] = 1 else: print("the word: %s is not in my Vocabulary!" % word) return returnVec # 训练朴素贝叶斯分类器 def trainNB0(trainMatrix,trainCategory): numTrainDocs = len(trainMatrix) numWords = len(trainMatrix[0]) pAbusive = sum(trainCategory)/float(numTrainDocs) # 计算侮辱性文档的概率 p0Num = ones(numWords); p1Num = ones(numWords) # 创建numpy.ones数组,词条出现数初始化为1，拉普拉斯平滑 p0Denom = 2.0; p1Denom = 2.0 # 分母初始化为2，拉普拉斯平滑 for i in range(numTrainDocs): if trainCategory[i] == 1: # 统计属于侮辱类的条件概率所需的数据，即P(w0|1),P(w1|1),P(w2|1),... p1Num += trainMatrix[i] p1Denom += sum(trainMatrix[i]) else: # 统计属于非侮辱类的条件概率所需的数据，即P(w0|0),P(w1|0),P(w2|0),... p0Num += trainMatrix[i] p0Denom += sum(trainMatrix[i])) p1Vect = log(p1Num/p1Denom) # 取对数，防止下溢出 p0Vect = log(p0Num/p0Denom) return p0Vect,p1Vect,pAbusive # 测试朴素贝叶斯分类器 def classifyNB(vec2Classify, p0Vec, p1Vec, pClass1): p1 = sum(vec2Classify * p1Vec) + log(pClass1) # 元素相乘 p0 = sum(vec2Classify * p0Vec) + log(1.0 - pClass1) if p1 > p0: return 1 else: return 0 # 测试朴素贝叶斯分类器的效果 def testingNB(): listOPosts,listClasses = loadDataSet() # 创建实验样本 myVocabList = createVocabList(listOPosts) # 创建词汇表 trainMat=[] for postinDoc in listOPosts: trainMat.append(setOfWords2Vec(myVocabList, postinDoc)) # 将实验样本向量化 p0V,p1V,pAb = trainNB0(array(trainMat),array(listClasses)) # 训练朴素贝叶斯分类器 testEntry = ['love', 'my', 'dalmation'] # 测试样本1 thisDoc = array(setOfWords2Vec(myVocabList, testEntry)) print(testEntry,'classified as: ',classifyNB(thisDoc,p0V,p1V,pAb)) testEntry = ['stupid', 'garbage'] # 测试样本2 thisDoc = array(setOfWords2Vec(myVocabList, testEntry)) print(testEntry,'classified as: ',classifyNB(thisDoc,p0V,p1V,pAb)) testingNB() ```

阅读全文

朴素贝叶斯的python代码实例

相关推荐

python 实现朴素贝叶斯算法的示例

朴素贝叶斯的Python代码实战.zip

朴素贝叶斯python代码实现.docx

朴素贝叶斯python代码实例垃圾邮件

native bayes朴素贝叶斯的python代码实现

朴素贝叶斯算法python实例

朴素贝叶斯调包实例python代码

朴素贝叶斯调包实例python代码，数据集为iris

朴素贝叶斯python

朴素贝叶斯python鸢尾花

贝叶斯分类python代码实例

朴素贝叶斯算法 python代码实战

朴素贝叶斯分类器python实例

朴素贝叶斯算法python底层代码

朴素贝叶斯事例代码

python朴素贝叶斯代码

朴素贝叶斯代码

16-17 数据挖掘算法基础 - 分类与回归1(1).ipynb

精选微信小程序源码：停车场管理小程序（含源码+源码导入视频教程&文档教程，亲测可用）

最新推荐

python中sklearn的pipeline模块实例详解

16-17 数据挖掘算法基础 - 分类与回归1(1).ipynb

精选微信小程序源码：停车场管理小程序（含源码+源码导入视频教程&文档教程，亲测可用）

最新闪客网盘系统源码支持限速+按时收费+文件分享+可对接易支付

C语言数组操作：高度检查器编程实践

管理建模和仿真的文件

【KUKA系统变量进阶】：揭秘从理论到实践的5大关键技巧

如何使用Python编程语言创建一个具有动态爱心图案作为背景并添加文字'天天开心（高级版）'的图形界面？

基于Swift开发的嘉定单车LBS iOS应用项目解析

"互动学习：行动中的多样性与论文攻读经历"