首页用jieba分词做excel文档词频分析

用jieba分词做excel文档词频分析

时间: 2023-11-21 16:05:42 浏览: 97

首先，需要安装`jieba`和`openpyxl`库，可以使用以下命令安装： ``` pip install jieba openpyxl ``` 假设要分析的Excel文件名为`data.xlsx`，其中需要分析的文本在`Sheet1`的`A`列中，可以使用以下代码实现词频分析： ```python import jieba from collections import Counter from openpyxl import load_workbook # 加载Excel文件 workbook = load_workbook('data.xlsx') sheet = workbook['Sheet1'] # 读取文本数据 text = '' for cell in sheet['A']: if cell.value: text += str(cell.value) # 分词并统计词频 word_list = jieba.cut(text) counter = Counter(word_list) # 将结果写入Excel文件 sheet['B1'] = '词汇' sheet['C1'] = '频次' row_num = 2 for word, freq in counter.most_common(): sheet.cell(row=row_num, column=2, value=word) sheet.cell(row=row_num, column=3, value=freq) row_num += 1 # 保存文件 workbook.save('result.xlsx') ``` 以上代码将使用`jieba`库对Excel文件中的文本进行分词，并使用`Counter`统计每个词汇出现的频次。最后，将结果写入Excel文件`result.xlsx`的`Sheet1`中的`B`列和`C`列。

阅读全文