python词频统计Dream_of_the_Red_Mansion里面的内容
时间: 2023-08-16 13:07:41 浏览: 95
Python之词频统计
好的,我可以为您提供一个Python程序,用于统计《红楼梦》中出现频率最高的前20个词汇:
```python
import jieba
from collections import Counter
# 读取文本内容
with open('dream_of_the_red_chamber.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba对文本进行分词
words = jieba.cut(text)
# 统计词频
counter = Counter(words)
# 获取出现频率最高的前20个词汇
top_words = counter.most_common(20)
# 输出结果
for word, count in top_words:
print(word, count)
```
请注意,此程序需要先安装jieba和collections库。并且需要将文本文件保存为'dream_of_the_red_chamber.txt'并放置在同一目录下。
阅读全文