pandas如何连续打开两个文件夹读取文件
时间: 2024-11-15 10:26:16 浏览: 17
Pandas库主要用于数据处理和分析,它本身并不直接支持文件夹操作。如果你想从两个不同的文件夹中读取文件,你需要首先定位到每个文件夹,然后分别读取文件。以下是一个简单的步骤:
1. 导入所需的`pandas`库:
```python
import os
import pandas as pd
```
2. 定义你要读取的两个文件夹路径:
```python
folder_path_1 = 'path/to/folder1'
folder_path_2 = 'path/to/folder2'
file_extension = '*.csv' # 或者其他的文件扩展名,如'.txt', '.xlsx'
```
3. 使用`os.listdir()`获取每个文件夹下的文件列表,并筛选出特定类型的文件:
```python
files_1 = [os.path.join(folder_path_1, f) for f in os.listdir(folder_path_1) if f.endswith(file_extension)]
files_2 = [os.path.join(folder_path_2, f) for f in os.listdir(folder_path_2) if f.endswith(file_extension)]
```
4. 分别读取每个文件并合并成DataFrame:
```python
dfs_list = []
for file in files_1:
dfs_list.append(pd.read_csv(file))
for file in files_2:
dfs_list.append(pd.read_csv(file))
# 如果你想合并成一个大DataFrame,可以使用`pd.concat()`
combined_df = pd.concat(dfs_list)
```
阅读全文