打开一个xlsx文件 写一个词频统计 按照逆序排序用结巴分词 写代码
时间: 2024-01-28 21:02:52 浏览: 192
好的,以下是 Python 代码实现,需要安装 `openpyxl` 和 `jieba` 模块:
```python
import openpyxl
import jieba
from collections import Counter
# 打开 Excel 文件
wb = openpyxl.load_workbook('example.xlsx')
sheet = wb.active
# 获取单元格内容并进行分词
words = []
for row in sheet.iter_rows(min_row=1, max_col=1, values_only=True):
for cell in row:
words += jieba.lcut(cell)
# 统计词频并按照逆序排序
word_count = dict(Counter(words))
sorted_word_count = sorted(word_count.items(), key=lambda x: x[1], reverse=True)
# 输出结果
for word, count in sorted_word_count:
print(word, count)
```
上述代码将 Excel 文件中第一列的单元格内容进行分词,统计每个词出现的次数,并按照逆序排序输出结果。如果你需要将结果写入 Excel 文件中,可以使用 `openpyxl` 模块中的相关函数进行操作。
阅读全文