dataframe合并两个表
时间: 2023-08-10 14:30:52 浏览: 94
pandas库中的merge()函数可以用来合并两个DataFrame,具体操作步骤如下:
1. 确认两个DataFrame中要合并的列名;
2. 使用merge()函数进行合并,指定要使用的合并列;
3. 根据需要进行数据清洗和重命名等操作。
下面是一个简单的示例代码,假设有两个DataFrame df1和df2,需要合并它们:
``` python
import pandas as pd
# 创建两个示例 DataFrame
df1 = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]})
df2 = pd.DataFrame({'Name': ['Bob', 'David', 'Emma'], 'Salary': [5000, 6000, 7000]})
# 使用 merge() 函数进行合并
merged_df = pd.merge(df1, df2, on='Name', how='outer')
# 根据需要进行数据清洗和重命名等操作
merged_df = merged_df.fillna(0) # 填充缺失值为 0
merged_df = merged_df.rename(columns={'Age': 'Age(years)', 'Salary': 'Salary(yuan)'}) # 重命名列名
# 打印结果
print(merged_df)
```
输出结果为:
```
Name Age(years) Salary(yuan)
0 Alice 25.0 0.0
1 Bob 30.0 5000.0
2 Charlie 35.0 0.0
3 David 0.0 6000.0
4 Emma 0.0 7000.0
```
注意,这里使用了 merge() 函数的 how 参数来指定了外连接操作,即保留两个 DataFrame 中所有的行。根据实际情况,你可能需要使用其他的合并方式,如内连接、左连接或右连接。具体可参考 pandas 文档中的说明。
阅读全文