def calBayes(self, wordList, spamdict, normdict): ps_w = 1 ps_n = 1 for word, prob in wordList.items(): print(word + "/" + str(prob)) ps_w *= (prob) ps_n *= (1 - prob) p = ps_w / (ps_w + ps_n) # print(str(ps_w)+"////"+str(ps_n)) return p
时间: 2023-06-27 15:02:28 浏览: 58
100_word-list_1.rar_Every Word_wordlist
这段代码实现了朴素贝叶斯分类器的计算过程,其中wordList是待分类的文本,spamdict和normdict是训练集中的垃圾邮件词汇和正常邮件词汇的概率字典。该函数的主要思路是利用朴素贝叶斯公式,根据每个单词在垃圾邮件和正常邮件中出现的概率,计算出待分类文本属于垃圾邮件的概率p。具体来说,对于每个单词,分别计算它在垃圾邮件中出现的概率ps_w和在正常邮件中出现的概率ps_n,并将所有单词的概率相乘得到ps_w和ps_n。最后,根据朴素贝叶斯公式计算出待分类文本属于垃圾邮件的概率p。
阅读全文