python 使用正则提取多份文件中 []中的内容全部提取
时间: 2024-12-20 17:31:05 浏览: 5
在Python中,使用正则表达式(`re`模块)提取多份文件中`[]`内的内容,你需要遍历文件、读取内容、匹配模式,然后提取所需的数据。下面是一个基本的例子,假设你想从所有的`.txt`文件中提取所有`[]`里的内容:
```python
import os
import re
# 指定要搜索的目录
directory = 'your_directory'
def extract_content_from_files(directory):
extracted_data = []
# 遍历目录及其子目录中的所有.txt文件
for root, dirs, files in os.walk(directory):
for file in files:
if file.endswith('.txt'):
file_path = os.path.join(root, file)
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
# 使用正则表达式提取[]内的内容
pattern = r'\[(.*?)\]'
# 找到所有匹配项并存储
matches = re.findall(pattern, content)
extracted_data.extend(matches)
return extracted_data
data = extract_content_from_files(directory)
print("提取到的所有[]内容:", data)
阅读全文