如何使用Pandas库通过递归的方式获取指定文件夹中的所有文件?
时间: 2024-10-21 11:14:07 浏览: 23
读取文件_读取文件夹里所有文件并提取_python_
使用Pandas库本身并不能直接进行递归文件查找,因为它是专注于数据处理和分析的工具。然而,我们可以借助Python的标准库`os`和`glob`来完成这个任务。下面是一个简单的例子,展示了如何通过递归获取指定文件夹及其子文件夹中的所有文件,特别是那些特定类型的文件(如`.csv`、`.xlsx`等):
```python
import os
import glob
def get_files_recursively(root_dir, file_extension):
all_files = []
# 使用os.walk遍历目录树
for root, dirs, files in os.walk(root_dir):
for file in files:
# 检查是否匹配指定的文件扩展名
if file.endswith(file_extension):
# 获取完整文件路径
file_path = os.path.join(root, file)
all_files.append(file_path)
return all_files
# 示例:获取名为"root_dir"的文件夹中所有的".txt"文件
root_dir = "your_directory_path"
file_extension = ".txt"
all_txt_files = get_files_recursively(root_dir, file_extension)
print(f"在'{root_dir}'找到的所有{file_extension}文件:")
print(all_txt_files)
```
在这段代码中,`os.walk`函数会遍历指定根目录下的所有子目录及文件,然后我们筛选出扩展名为指定文件类型的文件路径。
阅读全文