多个csv文件合并公共列为一个文件
时间: 2023-10-07 08:09:46 浏览: 84
合并多个CSV文件与一个文件中
可以使用Python中的pandas库来实现多个csv文件合并公共列为一个文件的操作。具体步骤如下:
1. 使用pandas库读取所有要合并的csv文件,并将它们存储到一个列表中。
```python
import pandas as pd
# 读取csv文件
df_list = []
for file_name in file_names:
df = pd.read_csv(file_name)
df_list.append(df)
```
2. 使用pandas库的merge函数合并所有csv文件。这里要注意设置合并的方式(inner、outer等)、合并的列以及如何处理缺失值等参数。
```python
# 合并csv文件
merged_df = pd.merge(df_list[0], df_list[1], on='common_column', how='outer')
for i in range(2, len(df_list)):
merged_df = pd.merge(merged_df, df_list[i], on='common_column', how='outer')
```
3. 将合并后的结果保存为一个新的csv文件。
```python
# 保存为新的csv文件
merged_df.to_csv('merged.csv', index=False)
```
以上是一个基本的合并csv文件的操作,根据具体的需求,还可以进行一些数据清洗、处理重复值等操作。
阅读全文