pandas合并两张表
时间: 2023-05-31 08:05:42 浏览: 124
使用pandas的merge函数可以将两张表按照指定的键(key)合并。下面是一个示例:
假设有两张表,一张是sales表,包含销售数据,另一张是customers表,包含客户信息。这两张表可以通过客户ID进行合并。
首先,读入两张表:
```python
import pandas as pd
# 读入sales表
sales = pd.read_csv('sales.csv')
# 读入customers表
customers = pd.read_csv('customers.csv')
```
接着,使用merge函数进行合并:
```python
# 按照客户ID合并
merged = pd.merge(sales, customers, on='customer_id')
```
在这个例子中,我们指定了键为'customer_id',即按照客户ID进行合并。
合并后的结果会生成一个新的DataFrame对象merged,包含了两张表的所有列和行。如果两张表有相同列名,merge函数会自动为其添加后缀,例如在这个例子中,sales表和customers表都有一个'name'列,合并后的结果中会有'name_x'和'name_y'两列。
merge函数还有其他参数可以用来控制合并的方式,例如:
- how参数:控制合并的方式,可以取值为'left', 'right', 'inner', 'outer',默认为'inner',即内连接。
- left_on和right_on参数:指定左表和右表的键,可以是不同的列名。
- suffixes参数:指定重复列名的后缀。
详细的参数说明可以参考pandas文档。
阅读全文