根据关键词文档内容,对文档B进行词频统计,并且输出excel,列为关键词文档中的关键词,行为对应词频,python代码怎么写
时间: 2023-04-09 22:01:49 浏览: 102
统计文本词频并输出为Excel表格形式——Python实现
5星 · 资源好评率100%
以下是Python代码示例,用于对文档B进行词频统计并输出Excel:
```python
import pandas as pd
import re
# 读取文档B
with open('文档B.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 读取关键词文档
with open('关键词文档.txt', 'r', encoding='utf-8') as f:
keywords = f.read().splitlines()
# 统计词频
word_freq = {}
for keyword in keywords:
pattern = re.compile(r'\b{}\b'.format(keyword))
freq = len(pattern.findall(text))
word_freq[keyword] = freq
# 输出Excel
df = pd.DataFrame(list(word_freq.items()), columns=['关键词', '词频'])
df.to_excel('词频统计.xlsx', index=False)
```
请注意,这只是一个示例代码,实际情况可能因文档格式、关键词数量等因素而有所不同。
阅读全文