python打开指定文件夹中的txt文件,提取关键词,放到一个新的excel中
时间: 2024-05-14 18:14:21 浏览: 236
以下是一个可能的解决方案:
```python
import os
import re
import xlwt
# 打开指定文件夹
folder_path = r'C:\example\folder'
file_list = os.listdir(folder_path)
# 创建Excel文件并添加表头
workbook = xlwt.Workbook(encoding='utf-8')
worksheet = workbook.add_sheet('keywords')
worksheet.write(0, 0, '文件名')
worksheet.write(0, 1, '关键词')
# 定义关键词列表
keywords = ['apple', 'banana', 'orange']
# 遍历所有txt文件并提取关键词
row = 1
for file_name in file_list:
if file_name.endswith('.txt'):
file_path = os.path.join(folder_path, file_name)
with open(file_path, 'r', encoding='utf-8') as f:
text = f.read()
# 使用正则表达式匹配关键词
matches = re.findall('|'.join(keywords), text)
if matches:
# 将匹配到的关键词写入Excel表格中
worksheet.write(row, 0, file_name)
worksheet.write(row, 1, ','.join(matches))
row += 1
# 保存Excel文件
workbook.save(os.path.join(folder_path, 'keywords.xls'))
```
这个脚本首先打开指定文件夹并列出其中所有文件的列表。然后,它创建了一个新的Excel文件,并添加了一个名为“keywords”的工作表,并在第一行添加了表头。接下来,它定义了要查找的关键词列表。然后,它遍历文件列表中所有以“.txt”结尾的文件,并使用正则表达式匹配其中的关键词。如果找到了关键词,它就将文件名和关键词写入Excel表格中。最后,它将Excel文件保存在与原始文件夹相同的位置。
阅读全文