pandas筛选相同表头的csv并进行合并
时间: 2023-06-29 12:11:18 浏览: 109
可以通过以下步骤实现:
1. 使用pandas库中的read_csv()方法读取所有csv文件,并将它们存储在一个字典对象中。使用glob库可以方便地找到所有需要读取的csv文件。
```python
import pandas as pd
import glob
path = '/path/to/folder/containing/csv/files'
all_files = glob.glob(path + "/*.csv")
csv_dict = {}
for filename in all_files:
df = pd.read_csv(filename)
csv_dict[filename] = df
```
2. 检查所有csv文件的表头是否相同,并将它们合并成一个DataFrame对象。可以使用pandas库中的concat()方法来完成这个任务。
```python
dfs = []
for key in csv_dict:
dfs.append(csv_dict[key])
merged_df = pd.concat(dfs, axis=0, ignore_index=True, sort=False)
```
在这里,我们使用了ignore_index=True参数来重置行索引,sort=False参数用于防止列名的重新排序。
3. 最后,将合并后的DataFrame对象保存到新的csv文件中。
```python
merged_df.to_csv('/path/to/output/file.csv', index=False)
```
这将把合并后的DataFrame对象保存到指定路径下的新csv文件中,并且不包含行索引。
阅读全文