首页pandas筛选相同表头的csv并进行合并

pandas筛选相同表头的csv并进行合并

时间: 2023-06-29 12:11:18 浏览: 109

可以通过以下步骤实现： 1. 使用pandas库中的read_csv()方法读取所有csv文件，并将它们存储在一个字典对象中。使用glob库可以方便地找到所有需要读取的csv文件。 ```python import pandas as pd import glob path = '/path/to/folder/containing/csv/files' all_files = glob.glob(path + "/*.csv") csv_dict = {} for filename in all_files: df = pd.read_csv(filename) csv_dict[filename] = df ``` 2. 检查所有csv文件的表头是否相同，并将它们合并成一个DataFrame对象。可以使用pandas库中的concat()方法来完成这个任务。 ```python dfs = [] for key in csv_dict: dfs.append(csv_dict[key]) merged_df = pd.concat(dfs, axis=0, ignore_index=True, sort=False) ``` 在这里，我们使用了ignore_index=True参数来重置行索引，sort=False参数用于防止列名的重新排序。 3. 最后，将合并后的DataFrame对象保存到新的csv文件中。 ```python merged_df.to_csv('/path/to/output/file.csv', index=False) ``` 这将把合并后的DataFrame对象保存到指定路径下的新csv文件中，并且不包含行索引。

阅读全文