Python进行文本分词并统计出现频率前10的关键词可视化
时间: 2023-05-28 18:02:23 浏览: 145
python实现统计文本中单词出现的频率详解
以下是使用Python进行文本分词并统计出现频率前10的关键词可视化的示例代码:
```python
import jieba
from collections import Counter
import matplotlib.pyplot as plt
# 读取文本文件内容
with open("text.txt", "r", encoding="utf-8") as f:
text = f.read()
# 对文本进行分词
words = jieba.cut(text)
# 统计词频并选取出现频率前10的关键词
counter = Counter(words)
top10 = counter.most_common(10)
# 可视化关键词词频分布
x = [i[0] for i in top10]
y = [i[1] for i in top10]
plt.bar(x, y)
plt.title("Top 10 Keywords")
plt.xlabel("Keywords")
plt.ylabel("Frequency")
plt.show()
```
在运行以上代码前,需要先安装jieba和matplotlib库。其中,jieba用于进行中文分词,matplotlib用于绘制关键词词频分布图。此外,代码中的"text.txt"需要替换为自己的文本文件路径。运行以上代码后,即可得到一张关键词词频分布图,展示了出现频率前10的关键词及其对应的词频。
阅读全文