jieba实现对csv词频统计
时间: 2023-11-17 08:59:46 浏览: 90
可以使用Python中的jieba库对csv文件进行分词,并结合Counter库进行词频统计。具体方法可以参考以下代码:
```python
import jieba
from collections import Counter
# 读取csv文件
with open('data.csv', 'r', encoding='utf-8') as f:
text = f.read()
# 对文本进行分词
seg_list = jieba.cut(text)
# 统计词频
word_counts = Counter(seg_list)
# 输出结果
for word, count in word_counts.most_common():
print(word, count)
```
以上代码会先读取名为"data.csv"的文件,然后使用jieba对文本进行分词,并使用Counter库统计词频。最后将结果按照出现频率从高到低输出。
阅读全文