用python遍历txt文件夹,按照关键词表提取txt文件中所有包含关键词的句子,最后将提取句子、关键词、文件名3项内容按行对应存储到xlsx中
时间: 2023-06-19 13:09:33 浏览: 242
可以使用Python中的os和xlwt库来实现。以下是一个示例代码:
```python
import os
import xlwt
# 定义关键词列表
keywords = ['keyword1', 'keyword2', 'keyword3']
# 创建Excel文件
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet('Sheet1')
# 写入表头
worksheet.write(0, 0, 'Sentence')
worksheet.write(0, 1, 'Keyword')
worksheet.write(0, 2, 'File')
# 定义行数
row = 1
# 遍历txt文件夹
for filename in os.listdir('txt_folder_path'):
# 判断文件是否为txt文件
if filename.endswith('.txt'):
# 打开文件
with open(os.path.join('txt_folder_path', filename), 'r') as f:
# 遍历每一行
for line in f:
# 遍历关键词
for keyword in keywords:
# 如果关键词在句子中
if keyword in line:
# 写入数据到Excel中
worksheet.write(row, 0, line.strip())
worksheet.write(row, 1, keyword)
worksheet.write(row, 2, filename)
# 行数加1
row += 1
# 保存Excel文件
workbook.save('output.xlsx')
```
请将`txt_folder_path`替换为你的txt文件夹路径,然后运行代码即可。该代码会遍历txt文件夹中的所有txt文件,按照关键词表提取包含关键词的句子,然后将提取句子、关键词、文件名3项内容按行对应存储到xlsx中。
阅读全文