Python怎样根据词表统计词频并把结果输出到文件
时间: 2024-02-12 14:03:12 浏览: 132
基于 python 实现英文文章的词频统计, 并画出词频图
要根据词表统计词频并将结果输出到文件中,可以使用Python中的collections库和pandas库。下面是一个示例代码,可以帮助你完成这个任务:
```python
import collections
import pandas as pd
# 读取要统计的文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 读取词表文件
with open('vocab.txt', 'r', encoding='utf-8') as f:
vocab = [line.strip() for line in f.readlines()]
# 统计词频
word_count = collections.Counter(text.split())
# 用pandas库将结果输出到文件
df = pd.DataFrame({'word': vocab, 'count': [word_count[word] for word in vocab]})
df.to_csv('result.csv', index=False)
```
这个示例代码首先从文件中读取要统计的文本和词表文件,然后使用collections库中的Counter类统计词频。接下来,使用pandas库将结果输出到CSV文件中。你可以根据自己的需求修改示例代码中的文件名和路径,并且可以使用不同的文件格式来输出结果。
阅读全文