首页朴素贝叶斯分类特征提取

朴素贝叶斯分类特征提取

时间: 2023-11-06 21:06:53 浏览: 81

人工智能-项目实践-文本分类-LDA模型提取文本特征，然后用朴素贝叶斯模型进行分类

5星 · 资源好评率100%

人工智能-项目实践-文本分类-LDA模型提取文本特征，然后用朴素贝叶斯模型进行分类核心思路是把分词之后的结果分为几类； LDA（Latent Dirichlet Allocation）模型可提取出来的且精度可以识别出来的 LDA模型可提取出来的但精度不够 LDA未提取到，没有出现在特征词表中对文本的内容毫无帮助的，比如标点符号和部分虚词第二类和第三类的词的概率该项目中都同时粗略地用了一种概率值，同时假设了LDA各主题等概率

朴素贝叶斯分类是一种基于贝叶斯定理的分类方法，它的特点是假设特征之间相互独立。在进行朴素贝叶斯分类时，需要对文本进行特征提取，将文本转化为特征向量。常用的特征提取方法有词袋模型和TF-IDF模型。词袋模型将文本表示为一个词汇表中的词语出现的频率向量，而TF-IDF模型则考虑了词语在整个语料库中的重要性。在进行特征提取后，可以使用朴素贝叶斯分类器对文本进行分类。

阅读全文