分词txt如何统计词频代码
时间: 2023-06-02 13:05:37 浏览: 92
分词统计词频.exe
以下是Python代码示例:
```
from collections import Counter
import jieba
# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba分词
words = jieba.lcut(text)
# 统计词频
word_counts = Counter(words)
# 输出前10个高频词
for word, count in word_counts.most_common(10):
print(word, count)
```
在这个代码示例中,我们使用了jieba库来进行中文分词,并使用Counter类来统计词频。其中,text.txt为需要统计词频的文本文件,可以自行修改。在输出高频词时,使用了most_common函数,并将参数设置为10,意味着输出前10个高频词。
阅读全文