写一段python代码,统计文件中各词语出现次数,输出一个xlsl文件按出现次数排列并写出具体次数
时间: 2024-12-17 08:43:35 浏览: 7
当然可以。首先,你需要安装`pandas`和`openpyxl`库来处理Excel文件。如果你还没有安装,可以在命令行中使用下面的命令安装:
```bash
pip install pandas openpyxl
```
接下来,这里是一个简单的Python脚本,它读取文本文件,统计每个单词的出现次数,并将结果保存到Excel文件中按出现次数排序:
```python
import re
from collections import Counter
import pandas as pd
# 读取文件内容
def read_file(file_name):
with open(file_name, 'r', encoding='utf-8') as file:
text = file.read().lower()
return text
# 统计单词频率
def count_words(text):
words = re.findall(r'\b\w+\b', text)
word_counts = Counter(words)
return dict(word_counts)
# 将结果转换为DataFrame并保存到Excel
def save_to_excel(word_counts, output_file):
df = pd.DataFrame.from_dict(word_counts, orient='index', columns=['Count'])
df.sort_values('Count', ascending=False, inplace=True)
df.to_excel(output_file, index_label='Word')
# 示例文件名
input_file = 'your_text_file.txt'
output_file = 'word_frequency.xlsx'
text = read_file(input_file)
word_counts = count_words(text)
save_to_excel(word_counts, output_file)
阅读全文