提取指定文件夹下所有子文件夹内的所有html文件
时间: 2023-08-14 21:02:57 浏览: 94
提取当前文件夹及子文件夹的所有文件名
5星 · 资源好评率100%
你可以使用`os.walk()`函数来遍历指定文件夹下所有子文件夹内的所有HTML文件。以下是一个示例代码:
```python
import os
folder_path = 'C:/Users/test/Desktop/DIDItest'
html_files = []
# 遍历文件夹及其子文件夹下所有HTML文件
for root, dirs, files in os.walk(folder_path):
for file in files:
if file.endswith('.html'):
html_files.append(os.path.join(root, file))
# 打印所有HTML文件路径
for file_path in html_files:
print(file_path)
```
这段代码会遍历指定文件夹及其子文件夹下的所有HTML文件,并将其路径保存在`html_files`列表中。你可以根据需要进一步处理这些文件,比如读取文件内容、提取信息等。
请记得将`folder_path`变量修改为你实际的文件夹路径。运行代码后,你会看到所有HTML文件的路径被打印出来。你可以根据需求,对这些文件进行进一步处理。
阅读全文