pandas concat函数
时间: 2023-10-13 19:14:37 浏览: 89
pandas concat函数是将两个或多个数据框或系列沿指定轴进行连接的函数。它可以按行或列进行连接,可以在连接时指定连接方式、连接键、是否保留索引等选项。具体语法如下:
```python
pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, sort=False, verify_integrity=False, copy=True)
```
其中,参数含义如下:
- objs:要连接的数据框或系列的列表或字典。
- axis:指定连接的轴,0表示按行连接,1表示按列连接,默认为0。
- join:指定连接方式,可以取值'outer'、'inner'、'left'、'right',分别表示外连接、内连接、左连接、右连接,默认为'outer'。
- ignore_index:是否忽略原来的索引,重新生成索引,默认为False。
- keys:将连接的数据框或系列加上一个多级索引,可以是列表、元组或数组,默认为None。
- sort:是否对连接后的数据进行排序,默认为False。
- verify_integrity:是否检查连接后的数据是否有重复索引,默认为False。
- copy:是否复制数据,默认为True。
示例:
```python
import pandas as pd
# 创建两个数据框
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})
# 按行连接
df_concat = pd.concat([df1, df2])
print(df_concat)
# 按列连接
df_concat = pd.concat([df1, df2], axis=1)
print(df_concat)
# 指定连接键
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4], 'key': ['K0', 'K1']})
df2 = pd.DataFrame({'C': [5, 6], 'D': [7, 8], 'key': ['K0', 'K1']})
df_concat = pd.concat([df1, df2], keys=['df1', 'df2'], join='inner', ignore_index=True)
print(df_concat)
```
输出结果:
```
A B
0 1 3
1 2 4
0 5 7
1 6 8
A B A B
0 1 3 5 7
1 2 4 6 8
key
0 K0
1 K1
2 K0
3 K1
```
阅读全文