用python循环遍历一个文件夹下所有的word文件,并提取其中所有的年月日时间参数存入列表中
时间: 2024-02-28 14:52:13 浏览: 108
好的,可以使用Python内置的os和docx模块来实现。以下是示例代码:
```python
import os
from docx import Document
from datetime import datetime
# 定义存储时间参数的列表
date_list = []
# 遍历文件夹下所有的word文件
for file in os.listdir('/path/to/folder'):
if file.endswith('.docx'):
# 打开word文件
doc = Document(os.path.join('/path/to/folder', file))
# 遍历文档中的所有段落
for para in doc.paragraphs:
# 遍历每个段落中的所有run
for run in para.runs:
# 判断run中是否包含日期时间格式
if run.text and run.text.strip():
try:
date = datetime.strptime(run.text.strip(), '%Y-%m-%d %H:%M:%S')
date_list.append(date)
except ValueError:
pass
# 打印所有提取到的日期时间
print(date_list)
```
需要根据实际情况修改文件夹路径和日期时间格式。这段代码可以遍历指定文件夹下所有的.docx文件,并提取其中的日期时间格式,存入一个列表中。
阅读全文