生成一段LDA主题模型代码
时间: 2023-05-12 19:04:26 浏览: 107
以下是用 Python 实现 LDA 主题模型的简单代码示例:
```
import numpy as np
import gensim
from gensim import corpora
from gensim.models import LdaModel
# 读取文本数据并预处理
texts = [["话题", "模型", "主题"],
["文本", "分析", "数据挖掘"],
["机器学习", "模型", "预测"],
["模型", "评估", "机器学习"],
["数据", "分析", "预测"]]
# 建立词典并获取词袋模型
dictionary = corpora.Dictionary(texts)
corpus = [dictionary.doc2bow(text) for text in texts]
# 训练LDA模型
lda = LdaModel(corpus=corpus, id2word=dictionary, num_topics=3)
# 打印每个主题的词语分布
for topic in lda.print_topics(num_words=3):
print(topic)
```
其中,`texts` 是一个包含多个文档的列表,每个文档为一个词语列表。`dictionary` 是通过文本数据构建的词典,而 `corpus` 是由词典转换得到的词袋模型。LDA 模型的训练过程在 `LdaModel` 函数中实现,最后通过 `print_topics` 函数打印每个主题的词语分布。
阅读全文