python实现EXCEL中文词频统计
时间: 2024-03-15 22:39:43 浏览: 216
统计文本词频并输出为Excel表格形式——Python实现
5星 · 资源好评率100%
在Python中实现Excel中文词频统计可以使用第三方库openpyxl来读取和写入Excel文件,以及使用jieba库进行中文分词和词频统计。下面是一个简单的示例代码:
```python
import openpyxl
import jieba
from collections import Counter
# 打开Excel文件
workbook = openpyxl.load_workbook('data.xlsx')
sheet = workbook.active
# 读取Excel中的中文文本
text = ''
for row in sheet.iter_rows():
for cell in row:
if cell.value:
text += str(cell.value)
# 使用jieba进行中文分词
words = jieba.cut(text)
# 统计词频
word_count = Counter(words)
# 将词频结果写入Excel文件
result_sheet = workbook.create_sheet('result')
result_sheet.append(['词语', '词频'])
for word, count in word_count.items():
result_sheet.append([word, count])
# 保存Excel文件
workbook.save('result.xlsx')
print("词频统计完成!")
```
上述代码首先使用openpyxl库打开Excel文件,然后读取其中的中文文本。接下来使用jieba库对文本进行分词,并使用Counter类进行词频统计。最后,将词频结果写入新的Excel文件,并保存。
阅读全文