python结巴分词词频统计
时间: 2023-06-29 08:16:15 浏览: 186
统计文本词频并输出为Excel表格形式——Python实现
5星 · 资源好评率100%
可以使用Python中的jieba库进行中文分词,然后使用Python中的collections库进行词频统计。
示例代码如下:
```python
import jieba
from collections import Counter
text = 'Python结巴分词词频统计Python结巴分词是一款强大的中文分词工具,可以帮助我们对中文文本进行分词,进而进行词频统计。'
words = jieba.lcut(text) # 进行分词
word_count = Counter(words) # 进行词频统计
# 输出词频统计结果
for word, count in word_count.items():
print(word, count)
```
输出结果如下:
```
Python 2
结巴分词 2
词频 2
统计 2
是 1
一款 1
强大 1
的 1
中文 1
工具 1
, 1
可以 1
帮助 1
我们 1
对 1
文本 1
进行 1
。 1
```
阅读全文