python实现LDA的代码
时间: 2024-10-08 22:23:06 浏览: 39
Python 中可以使用多种库来实现 Latent Dirichlet Allocation (LDA)主题模型,其中 Gensim 是一个常用的库,它提供了方便易用的接口。以下是使用 Gensim 进行 LDA 模型训练的一个简单示例:
```python
from gensim import corpora, models
# 假设我们已经有了文本数据和词典
texts = ... # 例如是一系列已经分词处理过的文档列表
dictionary = corpora.Dictionary(texts)
# 转换为文档-词频矩阵
corpus = [dictionary.doc2bow(doc) for doc in texts]
# 设置 LDA 模型参数
num_topics = 10 # 主题数量
passes = 10 # 搜索次数
chunksize = 1000 # 分块大小,提高效率
# 训练 LDA 模型
lda_model = models.LdaModel(corpus=corpus,
id2word=dictionary,
num_topics=num_topics,
passes=passes,
chunksize=chunksize)
# 打印一些主题及其关键词
for idx, topic in lda_model.show_topics(formatted=True):
print(f'Topic {idx}: {topic}')
阅读全文