python遍历文件夹中的所有txt,提取所有含关键字的句子
时间: 2024-05-13 17:16:26 浏览: 126
你可以使用Python的os和re模块来遍历文件夹中的所有txt文件,然后使用正则表达式来匹配关键字并提取句子。
以下是一个示例代码:
```python
import os
import re
# 定义要匹配的关键字
keywords = ['apple', 'banana', 'orange']
# 定义正则表达式
pattern = re.compile(r'[^\n.]*(' + '|'.join(keywords) + r')[^\n.]*[.?!]')
# 遍历文件夹
for root, dirs, files in os.walk('/path/to/folder'):
for file in files:
# 只处理txt文件
if file.endswith('.txt'):
# 打开文件并读取内容
with open(os.path.join(root, file), 'r') as f:
content = f.read()
# 查找匹配的句子
matches = re.findall(pattern, content)
# 打印匹配的句子
for match in matches:
print(match)
```
这个代码会遍历指定文件夹中的所有txt文件,然后使用正则表达式匹配含有关键字的句子,并打印出来。你需要将`/path/to/folder`替换为你实际的文件夹路径,将`keywords`替换为你要匹配的关键字列表。
阅读全文