用Python编写代码,练习jieba分词包的使用,对.txt进行分词,并将词频数位于前100的词语统计输出
时间: 2023-06-20 13:07:35 浏览: 94
用Python中的jieba对文章进行词频统计
好的,以下是代码示例:
```python
import jieba
from collections import Counter
# 打开文件,读取文本内容
with open('example.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba分词,得到分词结果列表
word_list = jieba.lcut(text)
# 使用Counter统计词频,并取前100个
word_freq = Counter(word_list).most_common(100)
# 输出结果
for word, freq in word_freq:
print(word, freq)
```
其中,`jieba.lcut()`函数将文本内容分词得到一个列表。`Counter()`函数用于统计列表中各元素出现的次数,返回一个字典。`most_common(100)`方法用于取出前100个出现次数最多的元素。
如果要将结果保存到文件中,可以在最后添加如下代码:
```python
# 将结果保存到文件中
with open('result.txt', 'w', encoding='utf-8') as f:
for word, freq in word_freq:
f.write(word + ' ' + str(freq) + '\n')
```
阅读全文