python 打开文件夹中的多个txt,每个txt读取去除标点后的“1”和“2”之间的内容,并存入列表
时间: 2024-05-31 12:08:37 浏览: 126
可以使用Python内置的os和re模块来完成此任务。具体步骤如下:
1. 使用os模块中的listdir函数列出文件夹中的所有文件名。
2. 使用re模块中的compile函数编译一个正则表达式,用于匹配文本中的“1”和“2”之间的内容。
3. 遍历文件夹中的所有文件,使用with open打开每个文件,使用正则表达式匹配文本中的“1”和“2”之间的内容,并将匹配结果添加到一个列表中。
4. 返回列表。
下面是示例代码:
import os
import re
def extract_text_between_1_and_2(folder_path):
# 列出文件夹中的所有文件名
file_names = os.listdir(folder_path)
# 编译正则表达式,用于匹配文本中的“1”和“2”之间的内容
pattern = re.compile(r'1(.*?)2', re.DOTALL)
# 存储匹配结果的列表
results = []
# 遍历文件夹中的所有文件
for file_name in file_names:
# 使用with open打开文件,避免忘记关闭文件
with open(os.path.join(folder_path, file_name), 'r') as f:
# 读取文件内容
content = f.read()
# 使用正则表达式匹配文本中的“1”和“2”之间的内容
match = pattern.search(content)
if match:
# 将匹配结果添加到列表中
results.append(match.group(1))
# 返回结果列表
return results
注意,以上代码仅供参考,实际情况中可能需要根据具体需求进行修改。
阅读全文