python实现LDA的详细代码举例
时间: 2024-10-08 13:23:46 浏览: 40
在Python中,我们可以使用gensim库来实现Latent Dirichlet Allocation (LDA)主题模型。以下是一个简单的例子,展示了如何使用gensim中的`LdaModel`类:
```python
from gensim import corpora, models, utils
# 假设我们有以下文本数据
texts = [
['计算机', '科学', '应用'],
['自然语言', '处理', '机器学习'],
['人工智能', '深度学习', '神经网络'],
# 更多文档...
]
# 预处理:将文本转换为词袋模型
dictionary = corpora.Dictionary(texts)
corpus = [dictionary.doc2bow(doc) for doc in texts]
# 设置LDA模型参数
num_topics = 2 # 主题数量
passes = 10 # 模型训练迭代次数
chunksize = 100 # 文档分块大小
# 训练LDA模型
lda_model = models.LdaModel(corpus, id2word=dictionary, num_topics=num_topics, passes=passes, chunksize=chunksize)
# 打印每个主题的前几个单词
for topic_idx, topic in lda_model.show_topics(formatted=True, num_words=5):
print(f"Topic {topic_idx + 1}: {topic}")
阅读全文