python爬虫在文件夹中选取文件读取关键词
时间: 2024-10-18 19:08:15 浏览: 39
在Python中,如果你想要从指定的文件夹中选取文件并读取关键词,可以使用`os`模块来遍历文件夹,`re`模块来查找关键词。以下是一个简单的示例:
```python
import os
import re
# 定义要搜索的关键词列表
keywords = ['keyword1', 'keyword2', 'keyword3']
# 指定文件夹路径
folder_path = '/path/to/your/folder'
# 遍历文件夹内的所有文件
for filename in os.listdir(folder_path):
if filename.endswith('.txt'): # 只处理.txt类型的文件
file_path = os.path.join(folder_path, filename)
with open(file_path, 'r') as f:
content = f.read()
# 使用正则表达式查找关键词
for keyword in keywords:
if re.search(keyword, content, re.IGNORECASE): # 忽略大小写
print(f"找到关键词 '{keyword}' 在文件 {file_path}")
```
在这个例子中,我们首先定义了一组关键词,然后指定要搜索的文件夹。`os.listdir()`获取文件夹中的文件名,`os.path.join()`用于构造完整文件路径。接着,打开每个文件并读取内容,`re.search()`函数会查找是否存在匹配的关键词。如果找到,我们会打印出相关信息。
阅读全文