python文本统计功能之西游记用字统计操作实例下载
时间: 2023-10-13 17:24:44 浏览: 121
很抱歉,作为AI语言模型,我没有提供下载功能。但是,你可以自己动手实现这个功能。以下是一个简单的Python代码示例,可以实现对《西游记》中出现的汉字进行统计:
```python
# -*- coding:utf-8 -*-
import jieba
import os
# 读取《西游记》文本文件
with open(os.path.join(os.getcwd(), "xijuzhi.txt"), "r", encoding="utf-8") as f:
text = f.read()
# 使用jieba分词对文本进行分词
words = jieba.cut(text)
# 统计每个汉字出现的次数
word_counts = {}
for word in words:
if len(word) == 1 and word != " ":
if word in word_counts:
word_counts[word] += 1
else:
word_counts[word] = 1
# 输出结果
print("《西游记》用字统计结果:")
for word, count in sorted(word_counts.items(), key=lambda x: x[1], reverse=True):
print(word, count)
```
在这个代码示例中,我们首先读取《西游记》文本文件,然后使用jieba分词对文本进行分词。接着,我们统计每个汉字出现的次数,并将结果按照出现次数从大到小排序输出。
阅读全文